참고자료 list - sogang-nlp-paper/WNGT-2019-DGT-NLG-Track GitHub Wiki
WNGT 2019 DGT task 관련 논문, 코드, 기타 자료 정리
keywords: RotoWire dataset, data to text, data to document, concept to document, generating text from structured data,
직접 관련 논문
Rotowire dataset 사용해서 동일한 task 푸는 논문들
-
Wiseman et al., Challenges in Data-to-Document Generation, EMNLP 2017
- RotoWire dataset 배포 / Copy mechanism기반 baseline model / evaluation 방법 제안
- 저자 코드는 OpenNMT-lua
- 이 논문을 레퍼한 논문들...
-
Puduppully et al., Data-to-text Generation with Content Selection and Planning, AAAI 2019
- Generation을 select - planning 두 단계로 나눠서 진행(still end-to-end)
- 저자 코드는 OpenNMT-py에 기반한 것
-
Pudupully et al., Data-to-text Generation with Entity Modeling, ACL 2019(to appear)
참고할만 논문
WikiBio dataset
Table to text라는 점에서 비슷. 차이점은 input이 table of text라는 것, 정답 길이가 비교적 짧다는 것.
-
- WikiBio dataset 처음으로 만듦
-
Liu et al., Table-to-text Generation by Structure-aware Seq2seq Learning, AAAI 2018
-
Bao et al., Table-to-text: Describing Table Region with Natural Language, AAAI 2018
기타
-
Gehrmann et al., End-to-End Content and Plan Selection for Data-to-Text Generation, INLG 2018
- INLG는 ACL anthology에 archive되는 학회이긴 함 듣보 아님
- E2E NLG라는 dataset
- Puduppully et al.과 비슷하게 단계를 나누어서 generation하는듯?
-
Zhang et al., Pretraining-Based Natural Language Generation for Text Summarization, arXiv 2019
- BERT를 generation task에 사용하는 논문
- 아직 arXiv 논문임..
-
고영중 교수님이 말씀하신 robot journalism
- 서울대학교 이준환 교수님, 로봇 저널리즘 관련 강연
- key event detection(19:42) - 경기 통계에서 필요한 것 뽑아내기 위해
- 가중치(28:00) - home 혹은 away기준으로 기사를 작성하기 위해서?