AD

잡담 한글 자연어처리 데이터 수집 관련

stylerjy
2020-01-09 12:54:42 138 3 0

한줄요약 : 한글 자연어 처리(맞춤법) 연구 하고 있습니다. 도와주세요(링크)  https://korpus.junheecho.com/


안녕하세요.

저희는 일상생활에서 발생하는 ‘한글’로 쓰여진 맞춤법과 문법 오류를 줄일 수 있는 인공지능 모델을 연구하는 팀 DeepNLP입니다. 


한글을 강조한 이유는 영문에 대한 인공지능 연구에 비해 연구 데이터가 턱 없이 적기 때문입니다. 

영어를 쓰는 인구와 한글을 쓰는 인구를 비교하면 너무나 당연하지만... 그럼에도 불구하고 적어도 너무 적어요. 

 

자연어처리 연구를 하기 위해 가장 기본이 되는 것이 데이터인데… 

1b9f1ac32cbc38c5216390e9eab12af5.png

연구와 마찬가지로 한글 데이터는 너무 적거나 오래된 것들이 많아 사용할 수 있는 데이터가 영어에 비해 현격히 적은 실정입니다. 

그래서 저희는 트게더 회원님들에게 도움(구걸)을 요청 드리고자 합니다. 


저희 연구팀은 인공지능 기반 한국어 맞춤법 검사기를 개발하는 프로젝트를 위해 한국어를 모국어로 사용하는 사람의

자연스러운 언어 습관에 따라 (어법 오류가 포함된) 문장을 연구 및 비상업적 목적으로 수집하고 있습니다. 


여러분의 하나하나의 기여가 큰 도움이 될 것입니다. 

연구에 기여하시는 방법은, 아래 페이지에서 들어가서 재생되는 문장을 편하게 받아 적어주시면 됩니다. 


도와주신 분들의 노력에 보답하고자 참여해주시는 분들의 닉네임은 사이트에 명시하고, 연구 결과와 이 데이터는 오픈소스로 배포하도록 하겠습니다. 

그리고, 감사의 표시로 작지만 참가자 20분께 추첨을 통해 스타벅스 기프티콘을 보내드립니다 :) 

(기프티콘은 1월 30일에 참가자의 이메일로 통해 발송됩니다.)


많은 참여와 함께 홍보 부탁드립니다.

감사합니다. 


연구 참여하기 : 링크  https://korpus.junheecho.com/

댓글 0개  
이전 댓글 더 보기
▼아랫글 여기 죽었나요? 노른자랑흰자
공지잡담최신뉴스자료공유연구/플젝Q&A
1
잡담
여기 죽었나요? [2]
노른자랑흰자
11-12
7
잡담
딥게더 죽지 않았다면 정답을 알려줘 [1]
공포게임초고수서나랑
10-29
1
잡담
질문하나 드립니다 [2]
루버거
09-25
13
08-22
1
잡담
캐글하는 트수들 있나요? [2]
이탈예측생존분석
06-02
3
05-21
3
잡담
Papers with Code [1]
참신한기획
04-29
11
04-22
8
자료공유
4월 16일 논문 리뷰 방송 [1]
Moderator 베일쿤
04-15
4
04-10
3
최신뉴스
Ian Goodfellow 애플로 이직 [2]
Global Moderator gamingryan235
04-05
7
04-05
인기글 글 쓰기