파이썬으로 한글파일 채택완료

첫번째로는

[

olefile이라는 모듈을썼는데요 실행시 한글페이지는 30페이지가 넘는데 2페이지만 터미널에 나옵니다 이럴때 어떻게 해결해야하나요???

두번째로는

하나의 품목에 여러명의 사람이 있을때 어떻게 서로 엮어주는지 잘 모르겠습니다.

예) (품목, 이름, 개수)

import olefile
f = olefile.OleFileIO('11-20.hwp')
encoded_text = f.openstream('PrvText').read()
decoded_text = encoded_text.decode('UTF-16')
print(decoded_text)

find_item = re.findall(r"<품 목 : ><(.*?)><", decoded_text)

find_number = re.findall(r"<비품총괄대장에서 이기><(.*?)><><><><", decoded_text)

find_name = re.findall(r"\d><><><><\d><(.*?)>", decoded_text)

item_list = find_item
string_list = find_name
int_list = find_number
for string, integer in zip ( string_list, int_list):
    print(string, integer)

]

 

1891314478_1602811245.8613.png

답변 1개

채택된 답변
+20 포인트

첫번째 문제는 

일단 필터링 하지말고 그냥 파일을 전체가 다 읽는지 확인해보세요

파일의 사이즈를 확인하고 read 에 파일 사이즈를 다 읽게 하던지

아니면 블럭으로 잘라서 size 만큼 읽어오세요

 

두번째 문제는 

품목을 key 값으로 사람 이름을 list 로 넣으면 되죠

 

로그인 후 평가할 수 있습니다

댓글을 작성하려면 로그인이 필요합니다.

답변을 작성하려면 로그인이 필요합니다.

로그인
🐛 버그신고