데이터셋
-
DataSet paper 리뷰 #1 CoQA : A Conversational Question Answering ChallengeREVIEW 2020. 4. 16. 11:32
abstract 127k Q and A , 8K conversation pasages, QA에 대한 Evidence존재. 대화형 질문이기에 기존의 지문보다 다른 현상을 보임 Introduction 전체 데이터 셋이 대화가 아니라 QA부분만 대화형식 첫번째 목표. 대화 속에서 자연스러운 질문을 찾는것. → 질문이 짧아도(ex. Who?) 의미를 찾을 수 있도록. 두번째 목표. 대화에 자연스러운 답변을 하는 것. 기존의 QA는 주어진 passage에서 부분을 찾아내는 것임. → Free From answer. (dataset ex. MS MARCO, NarrativeQA) → BLEU, ROUGE metric 세번째 목표. 여러 도메인에 적용 가능. 해당 데이터 셋은 Children's stories, li..