파이썬으로 한글파일

파이썬으로 한글파일

QA

파이썬으로 한글파일

본문

첫번째로는

[

olefile이라는 모듈을썼는데요 실행시 한글페이지는 30페이지가 넘는데 2페이지만 터미널에 나옵니다 이럴때 어떻게 해결해야하나요???

두번째로는

하나의 품목에 여러명의 사람이 있을때 어떻게 서로 엮어주는지 잘 모르겠습니다.

예) (품목, 이름, 개수)

import olefile
f = olefile.OleFileIO('11-20.hwp')
encoded_text = f.openstream('PrvText').read()
decoded_text = encoded_text.decode('UTF-16')
print(decoded_text)

find_item = re.findall(r"<품 목 : ><(.*?)><", decoded_text)

find_number = re.findall(r"<비품총괄대장에서 이기><(.*?)><><><><", decoded_text)

find_name = re.findall(r"\d><><><><\d><(.*?)>", decoded_text)

item_list = find_item
string_list = find_name
int_list = find_number
for string, integer in zip ( string_list, int_list):
    print(string, integer)

]

 

1891314478_1602811245.8613.png

이 질문에 댓글 쓰기 :

답변 1

첫번째 문제는 

일단 필터링 하지말고 그냥 파일을 전체가 다 읽는지 확인해보세요

파일의 사이즈를 확인하고 read 에 파일 사이즈를 다 읽게 하던지

아니면 블럭으로 잘라서 size 만큼 읽어오세요

 

두번째 문제는 

품목을 key 값으로 사람 이름을 list 로 넣으면 되죠

 

답변을 작성하시기 전에 로그인 해주세요.
전체 122
QA 내용 검색

회원로그인

(주)에스아이알소프트 / 대표:홍석명 / (06211) 서울특별시 강남구 역삼동 707-34 한신인터밸리24 서관 1404호 / E-Mail: admin@sir.kr
사업자등록번호: 217-81-36347 / 통신판매업신고번호:2014-서울강남-02098호 / 개인정보보호책임자:김민섭(minsup@sir.kr)
© SIRSOFT