자료실

부자는 돈을 써서 시간을 아끼지만 가난한 사람은 시간을 써서 돈을 아낀다

C#

IT HUB를 찾아주셔서 감사합니다.

C# [한글 ActiveX C#] 한글문서로 부터 Text, Html추출

페이지 정보

profile_image
작성자 하나를하더라도최선을
댓글 0건 조회 5,114회 작성일 19-08-03 00:04

본문


string filePath = @"c:\sample.hwp"   //샘플 한글파일의 경로
HwpCtrl1.Open(filePath);

textBox.text = HwpCtrl1.GetTextFile("TEXT","").ToString();  
// 작업환경은 윈폼이고, 폼에 textBox가 올려져 있다고 가정한 코드이다.
// 한글 파일로부터 TEXT 추출시 HTML로 추출을 원하면 해당 값을 HTML로 입력하면 된다.

참 쉽죠잉~~~!!



삽질하다 알게된 다른 방법이 있다.

string filePath = @"c:\sample.hwp"   //샘플 한글파일의 경로
HwpCtrl1.Open(filePath);

// 여기까지는 동일하다.

HwpCtrl1.InitScan();   // 문서 검색을 위한 초기화
while(GetText() != 1)
{
}
HwpCtrl1.ReleaseScan();   //InitScan()으로 설정된 정보를 초기화 한다.


private int GetText()
        {
            int ret = 0;

            HWPCONTROLLib.HwpParameterSet TextSet; 
            TextSet = (HWPCONTROLLib.HwpParameterSet)HwpCtrl1.CreateSet("GetText");
            ret = HwpCtrl1.GetTextBySet(TextSet);
            var txt = TextSet.Item("Text");
           
            textBox1.Text += txt;
            return ret;
        }

댓글목록

등록된 댓글이 없습니다.