KoGPT
: 카카오에서 학습시킨 자연어처리 모델
: AI 커뮤니티를 위한 연구용으로 욕설, 음란, 정치적 내용 및 기타 거친 언어에 대한 처리를 하지 않은 원시 데이터로 학습
: 사회적으로 용인되지 않은 텍스트를 생성할 수 있음.
: 주로 한국어 텍스트로 학습
: 텍스트를 분류, 검색, 요약, 생성하는데 적합
: 방언, 한국어가 아닌 경우, 학습 데이터에서 발견하기 어려운 입력시에 성능이 좋지 않음.
참고 블로그 url(코드와 용법)
https://velog.io/@gtpgg1013/kogpt-%ED%95%9C%EA%B5%AD%EC%96%B4-%EC%83%9D%EC%84%B1-GPT-3-%EB%AA%85%EB%AC%B8%EA%B0%80-%EB%82%A9%EC%8B%9C%EC%98%A4
블로그 내용을 통한 KoGPT의 기능 확인
1) 제목과 내용을 2줄 주었을 때 뒷 문장을 생성함
2) 질문이 주어졌을 때 답변을 생성하고, 스스로 질문과 답변을 생성함.
3) 뉴스 요약 가능
4) 표준어를 전라도 사투리로 요청한 경우, 사투리로 문장 생성(그러나 실패가 더 많음)
5) 영어 번역은 짧은 문장에 대해서만 좋은 성능을 냄.
'머신러닝' 카테고리의 다른 글
머신러닝 딥러닝 데이터분석 토이 데이터셋 (0) | 2022.12.16 |
---|---|
비전공자 머신러닝 책 추천 - 입문 (0) | 2022.12.03 |
비전공자 머신러닝 책 추천하기에 앞서 (0) | 2022.12.02 |