푸른개미의 블로그: python에서 html에서 읽어온 string 한글 검색

2009년 12월 30일 수요일

python에서 html에서 읽어온 string 한글 검색

urlopen으로 읽어온 스트링에서 한글 검색하는 코드이다.


# -*- coding: utf-8 -*-
import urllib
import re

class MyOpener(urllib.FancyURLopener):
    version = 'Mozilla/5.0 (Windows; U; Windows NT 5.1; it; rv:1.8.1.11) Gecko/20071127 Firefox/2.0.0.11'

def Translate(eng):
    urllib._urlopener = MyOpener()
    
    f = urllib.urlopen('http://www.google.co.kr/dictionary?langpair=en|ko&q='+eng+'&hl=ko&aq=f')
    html = f.read()
    str = unicode('영어 > 한국어','euc-kr').encode('utf-8')
    pos_ko = html.find(str)
    str = unicode('영어 사전','euc-kr').encode('utf-8')
    pos_en = html.find(str, pos_ko)

    
if __name__ == '__main__':
    Translate('TEST')

푸른개미의 블로그

2009년 12월 30일 수요일

python에서 html에서 읽어온 string 한글 검색

댓글 없음:

댓글 쓰기

프로필

팔로어

블로그 보관함