참고자료 list - sogang-nlp-paper/WNGT-2019-DGT-NLG-Track GitHub Wiki
WNGT 2019 DGT task 관련 논문, 코드, 기타 자료 정리
keywords: RotoWire dataset, data to text, data to document, concept to document, generating text from structured data,
직접 관련 논문
Rotowire dataset 사용해서 동일한 task 푸는 논문들
Wiseman et al., Challenges in Data-to-Document Generation, EMNLP 2017
- RotoWire dataset 배포 / Copy mechanism기반 baseline model / evaluation 방법 제안
- 저자 코드는 OpenNMT-lua
- 이 논문을 레퍼한 논문들...
Puduppully et al., Data-to-text Generation with Content Selection and Planning, AAAI 2019
- Generation을 select - planning 두 단계로 나눠서 진행(still end-to-end)
- 저자 코드는 OpenNMT-py에 기반한 것
Pudupully et al., Data-to-text Generation with Entity Modeling, ACL 2019(to appear)
참고할만 논문
WikiBio dataset
Table to text라는 점에서 비슷. 차이점은 input이 table of text라는 것, 정답 길이가 비교적 짧다는 것.
- WikiBio dataset 처음으로 만듦
Liu et al., Table-to-text Generation by Structure-aware Seq2seq Learning, AAAI 2018
Bao et al., Table-to-text: Describing Table Region with Natural Language, AAAI 2018
Gehrmann et al., End-to-End Content and Plan Selection for Data-to-Text Generation, INLG 2018
- INLG는 ACL anthology에 archive되는 학회이긴 함 듣보 아님
- E2E NLG라는 dataset
- Puduppully et al.과 비슷하게 단계를 나누어서 generation하는듯?
Zhang et al., Pretraining-Based Natural Language Generation for Text Summarization, arXiv 2019
- BERT를 generation task에 사용하는 논문
- 아직 arXiv 논문임..
고영중 교수님이 말씀하신 robot journalism
- 서울대학교 이준환 교수님, 로봇 저널리즘 관련 강연
- key event detection(19:42) - 경기 통계에서 필요한 것 뽑아내기 위해
- 가중치(28:00) - home 혹은 away기준으로 기사를 작성하기 위해서?