2009년 12월 30일 수요일

python에서 html에서 읽어온 string 한글 검색

urlopen으로 읽어온 스트링에서 한글 검색하는 코드이다.

# -*- coding: utf-8 -*-
import urllib
import re

class MyOpener(urllib.FancyURLopener):
version = 'Mozilla/5.0 (Windows; U; Windows NT 5.1; it; rv:1.8.1.11) Gecko/20071127 Firefox/2.0.0.11'

def Translate(eng):
urllib._urlopener = MyOpener()

f = urllib.urlopen('http://www.google.co.kr/dictionary?langpair=en|ko&q='+eng+'&hl=ko&aq=f')
html = f.read()
str = unicode('영어 > 한국어','euc-kr').encode('utf-8')
pos_ko = html.find(str)
str = unicode('영어 사전','euc-kr').encode('utf-8')
pos_en = html.find(str, pos_ko)


if __name__ == '__main__':
Translate('TEST')

댓글 없음:

댓글 쓰기