hanspell: Korean spell checker

This is a package candidate release! Here you can preview how this package release will appear once published to the main package index (which can be accomplished via the 'maintain' link below). Please note that once a package has been published to the main package index it cannot be undone! Please consult the package uploading documentation for more information.

[maintain] [Publish]

This package includes hanspell, a simple command line spell check program and a library, Language.Hanspell. Both of them are based on DAUM spell check web service and Pusan National University spell check web service.


[Skip to Readme]

Properties

Versions 0.2.0.0, 0.2.1.0, 0.2.2.0, 0.2.3.0, 0.2.3.0
Change log None available
Dependencies aeson (>=1.4.7 && <1.6), async (>=2.2.2 && <2.3), base (>=4.7 && <5), bytestring (>=0.10.8 && <0.12), directory (>=1.3.0 && <1.4), hanspell, html-entities (>=1.1.4 && <1.2), http-client (>=0.6.4 && <0.8), http-client-tls (>=0.3.5 && <0.4), http-types (>=0.12.3 && <0.13), regex-compat-tdfa (>=0.95.1 && <0.96), split (>=0.2.3 && <0.3), text (>=1.2.3 && <1.3), transformers (>=0.5.2 && <0.6), unix (>=2.7.2 && <2.8), utf8-string (>=1.0.1 && <1.1) [details]
License MIT
Copyright 2020 Hyunrae Cho
Author Hyunrae Cho
Maintainer 9beach@gmail.com
Category language, korean, spellchecker
Home page https://github.com/9beach/hanspell-hs#readme
Bug tracker https://github.com/9beach/hanspell-hs/issues
Source repo head: git clone https://github.com/9beach/hanspell-hs
Uploaded by 9beach at 2021-02-25T14:01:08Z

Modules

[Index]

Downloads

Maintainer's Corner

For package maintainers and hackage trustees


Readme for hanspell-0.2.3.0

[back to package description]

hanspell-hs

hanspell-hs는 (주)다음과 부산대학교 인공지능연구실/(주)나라인포테크의 웹 서비스를 이용한 한글 맞춤법 검사기입니다.

자바스크립트로 작성한 hanspell도 있으니 참고하세요.

Hackage Hackage Dependencies Build Status

설치

카발을 이용해서 아래와 같이 설치하세요.

$ cabal update && cabal install hanspell
$ # `~/.cabal/bin/hanspell` created

스택을 이용해서 다음과 같이 설치할 수도 있습니다.

$ stack update && stack install hanspell
$ # `~/.local/bin/hanspell` created

일부 배포본에서는 위의 명령을 실행하기 전에 다음을 먼저 실행해야 할 수도 있습니다.

$ sudo apt install libz-dev

명령어 사용법

$ hanspell -h
사용법: hanspell [-d | -p | -a | -h] 

옵션:
  -d, --daum [default]	  다음 서비스를 이용해서 맞춤법을 교정합니다
  -p, --pnu               부산대학교 서비스를 이용해서 맞춤법을 교정합니다
  -a, --all 		  두 서비스의 모든 결과를 반영해서 맞춤법을 교정합니다
  -h, --info              도움말을 출력합니다

버그 리포트와 제안: <https://github.com/9beach/hanspell-hs/issues>
한스펠 홈 페이지: <https://github.com/9beach/hanspell-hs/>

문장을 직접 입력하거나 클립보드에서 복사해서 맞춤법을 교정할 수 있습니다. 다음은 사용 예시입니다. CTRL + D는 줄을 바꾸고 맨 앞에서 입력해야 합니다.

$ hanspell
나는 차가운 모래속에 두 손을 넣고 검게 빛나는 바다를 바라본다.
우주의 가장자리 같다.
쇼코는 해변에 서 있으면 이세상의 변두리에 선 느낌이 든다고 말했었다.
[CTRL + D]
모래속에 -> 모래 속에
띄어쓰기 오류입니다. 대치어를 참고하여 고쳐 쓰세요.
이세상의 -> 이 세상의
관형사는 뒤에 오는 말과 띄어 쓰는 것이 옳습니다.
...

스크린샷

파일의 맞춤법을 교정하려면 다음과 같이 명령합니다.

$ cat your-text | hanspell

로그는 생략한 채 교정된 문장만 보려면 다음과 같이 명령합니다.

$ cat your-text | hanspell 2> /dev/null
나는 차가운 모래 속에 두 손을 넣고 검게 빛나는 바다를 바라본다.
우주의 가장자리 같다.
쇼코는 해변에 서 있으면 이 세상의 변두리에 선 느낌이 든다고 말했었다.

교정 제안만 보려면 다음과 같이 명령합니다.

$ cat your-text | hanspell 2>&1 > /dev/null | grep '->'

클립보드에 복사된 문장을 입력 없이 바로 교정하려면, 맥OS 사용자는 pbpaste, X 윈도 시스템 사용자는 xclip -o, 마이크로소프트 윈도우 사용자는 powershell.exe Get-Clipboard 명령을 이용할 수 있습니다.

$ pbpaste | hanspell

~/.hanspell-ignore 파일에 교정 대상에서 제외할 문자열을 글로브 패턴으로 지정할 수 있습니다. "그로떼스끄"로 시작하는 문자열과 "빠이"를 교정 대상에서 제외하려면 다음과 같이 설정하세요.

그로떼스끄*
빠이

~/.hanspell-history 파일에 교정 내역이 기록됩니다.

$ sort < ~/.hanspell-history | uniq -c | sort -nr | head 
  17 모래속에 -> 모래 속에
  13 곤색이다 -> 감색이다
  13 곤색의 -> 감색의
  13 한바퀴 -> 한 바퀴
  13 돌껀데 -> 돌 건데
  10 리랜드는 -> 이랜드는
   9 말했더만 -> 말했더구먼
   7 주름투성이 -> 주름 투성이
   7 암소여서도 -> 암소 여서도
   7 열두살 -> 열두 살

터미널 및 파일 인코딩

hanspell은 UTF-8으로 설정된 터미널에서만 테스트되었습니다.

$ cat your-text.utf-8 | hanspell

홈 디렉터리의 .hanspell-ignore 파일 또한 UTF-8 인코딩으로 저장해야 합니다.

라이브러리 사용법

Language.Hanspell 라이브러리는 Typo 자료구조와 관련 함수, 그리고 spellCheckByDaum, spellCheckByPnu 함수를 제공합니다. 다음은 사용 예입니다.

module HanspellExample where

import Language.Hanspell

example = do
    let sentence = "위에계신분, 잘들리세요?"
    typos <- spellCheckByDaum sentence
    mapM_ (putStrLn . typoToStringWithStyle True) typos

다음의 결과가 예상됩니다.

위에계신분, -> 위에 계신 분,
뒤에 오는 명사를 수식하는 관형격 어미 ‘-ㄴ’, ‘-는’, ‘-던’, ‘-ㄹ’ 등과 의존명사는 띄어 쓰는 것이 옳습니다.
(예)
노력한 만큼 대가를 얻다.
소문으로만 들었을 뿐이네.
합격했다는 소리를 들으니 그저 기쁠 따름이다.

잘들리세요? -> 잘 들리세요?
'익숙하고 능란하게', '좋고 훌륭하게'라는 의미의 부사 '잘'은 띄어 쓰세요.
(예)
바둑을 잘 두다.
옷을 잘 차려입고 나서니 딴사람 같구나.
다음 대화를 잘 듣고 물음에 답하세요.