머신러닝

카카오브레인 KoGPT(Korean Generative Pre-trained Transformer)

하카데미 2022. 11. 2. 18:13

KoGPT
: 카카오에서 학습시킨 자연어처리 모델
: AI 커뮤니티를 위한 연구용으로 욕설, 음란, 정치적 내용 및 기타 거친 언어에 대한 처리를 하지 않은 원시 데이터로 학습
: 사회적으로 용인되지 않은 텍스트를 생성할 수 있음.
: 주로 한국어 텍스트로 학습
: 텍스트를 분류, 검색, 요약, 생성하는데 적합
: 방언, 한국어가 아닌 경우, 학습 데이터에서 발견하기 어려운 입력시에 성능이 좋지 않음. 


참고 블로그 url(코드와 용법)
https://velog.io/@gtpgg1013/kogpt-%ED%95%9C%EA%B5%AD%EC%96%B4-%EC%83%9D%EC%84%B1-GPT-3-%EB%AA%85%EB%AC%B8%EA%B0%80-%EB%82%A9%EC%8B%9C%EC%98%A4

 

블로그 내용을 통한 KoGPT의 기능 확인
1) 제목과 내용을 2줄 주었을 때 뒷 문장을 생성함
2) 질문이 주어졌을 때 답변을 생성하고, 스스로 질문과 답변을 생성함.
3) 뉴스 요약 가능
4) 표준어를 전라도 사투리로 요청한 경우, 사투리로 문장 생성(그러나 실패가 더 많음)
5) 영어 번역은 짧은 문장에 대해서만 좋은 성능을 냄.