반응형
궁금해서 정리해 봅니다.
Reference
1. ChatGPT의 응답품질은 시간이 지남에 따라 어떻게 평가되고 개선되나요?
1) 응답 품질평가에서 인간 검토자의 역활
- 인간 검토자는 ChatGPT 답변이 의도한 목표와 기대에 얼마나 잘 부합하는지 평가함
- 인간 검토자는 ChatGPT 가 인간과 같은 텍스트를 생성하는지의 품질을 평가한다
- 인간 검토자는 ChatGPT 가 공감할 수 있는 답변을 제공하고, 사용자의 우려사항을 효과적으로 해결하는지 문석한다.
2) 응답 정확도 평가
- ChatGPT의 정확도를 평가하기 위해서는 쿼리를 얼마나 잘 이해하고, 정보를 제공하는지 평가해야 함.
- 답변이 해당 분야의 전문가가 작성한 고품질의 테스트와 얼마나 유사한지 분석하는 것도 중요
- 모델 정확성 평가 방법
: 구체적인 질문을 하고 답변이 정확하고 신뢰할 수 있는지 검토 한다 (예: 특정 질환의 증상, 잠재적인 치료 옵션 질문)
3)
반응형
'- 배움이 있는 삶 > - AI | Big data' 카테고리의 다른 글
GPT-4 evaluation : GPT-4 Technical Report (0) | 2024.03.21 |
---|---|
Google Gemini vs Open AI GPT-4 성능 비교 평가 (0) | 2024.03.15 |
AI Image generators (1) | 2024.01.24 |
AI EXPO KOREA 2024 (국제인공지능대전): 24년. 5월. (0) | 2024.01.19 |
LLM / Chat GPT 성능평가 방법 (3) | 2024.01.04 |