파이썬으로 한글파일
본문
첫번째로는
[
olefile이라는 모듈을썼는데요 실행시 한글페이지는 30페이지가 넘는데 2페이지만 터미널에 나옵니다 이럴때 어떻게 해결해야하나요???
두번째로는
하나의 품목에 여러명의 사람이 있을때 어떻게 서로 엮어주는지 잘 모르겠습니다.
예) (품목, 이름, 개수)
import olefile
f = olefile.OleFileIO('11-20.hwp')
encoded_text = f.openstream('PrvText').read()
decoded_text = encoded_text.decode('UTF-16')
print(decoded_text)
find_item = re.findall(r"<품 목 : ><(.*?)><", decoded_text)
find_number = re.findall(r"<비품총괄대장에서 이기><(.*?)><><><><", decoded_text)
find_name = re.findall(r"\d><><><><\d><(.*?)>", decoded_text)
item_list = find_item
string_list = find_name
int_list = find_number
for string, integer in zip ( string_list, int_list):
print(string, integer)
]
답변 1
첫번째 문제는
일단 필터링 하지말고 그냥 파일을 전체가 다 읽는지 확인해보세요
파일의 사이즈를 확인하고 read 에 파일 사이즈를 다 읽게 하던지
아니면 블럭으로 잘라서 size 만큼 읽어오세요
두번째 문제는
품목을 key 값으로 사람 이름을 list 로 넣으면 되죠