• 쇼핑몰
  • 커뮤니티
  • 북마크

C#




[C#] [한글 ActiveX C#] 한글문서로 부터 Text, Html추출

하나를하더라도최선을
2019.08.03 00:04 729 0

본문




string filePath = @"c:\sample.hwp"   //샘플 한글파일의 경로
HwpCtrl1.Open(filePath);

textBox.text = HwpCtrl1.GetTextFile("TEXT","").ToString();  
// 작업환경은 윈폼이고, 폼에 textBox가 올려져 있다고 가정한 코드이다.
// 한글 파일로부터 TEXT 추출시 HTML로 추출을 원하면 해당 값을 HTML로 입력하면 된다.

참 쉽죠잉~~~!!



삽질하다 알게된 다른 방법이 있다.

string filePath = @"c:\sample.hwp"   //샘플 한글파일의 경로
HwpCtrl1.Open(filePath);

// 여기까지는 동일하다.

HwpCtrl1.InitScan();   // 문서 검색을 위한 초기화
while(GetText() != 1)
{
}
HwpCtrl1.ReleaseScan();   //InitScan()으로 설정된 정보를 초기화 한다.


private int GetText()
        {
            int ret = 0;

            HWPCONTROLLib.HwpParameterSet TextSet; 
            TextSet = (HWPCONTROLLib.HwpParameterSet)HwpCtrl1.CreateSet("GetText");
            ret = HwpCtrl1.GetTextBySet(TextSet);
            var txt = TextSet.Item("Text");
           
            textBox1.Text += txt;
            return ret;
        }



댓글목록 0

등록된 댓글이 없습니다.