2021 10 19 - KR-HappyFace/meetup-logs GitHub Wiki

  • μ˜μ§„λ‹˜: 랜덀 Masking + KE-T5 μ‹€ν—˜ 쀑 링크

    • T5λ₯Ό μ΄μš©ν•œ SQuAD 1.1 EM 89점 정도
  • DPR tutorial: https://colab.research.google.com/github/deepset-ai/haystack/blob/master/tutorials/Tutorial6_Better_Retrieval_via_DPR.ipynb

    • λ‹€μ–‘ν•œ token μ μš©ν•˜λŠ” 것 μ’‹μ•„λ³΄μž„
    • FAISS μ‹œκ°„ 단좕에 ν•„μˆ˜. 무쑰건 μ‚¬μš©ν•˜λŠ” 것이 μ’‹μ•„λ³΄μž„
    • Negative Sampling 무쑰건 μ μš©ν•˜λŠ” 것이 μ’‹λ‹€ (In batch negative sampling μ„±λŠ₯ ν–₯상 μžˆμ—ˆλ‹€κ³  논문에 기재)
    • Gold -> 우리 λ°μ΄ν„°μ…‹μ—λŠ” ν•΄λ‹Ήλ˜μ§€ μ•ŠλŠ” κ²ƒμœΌλ‘œ λ³΄μž„
    • λ…Όλ¬Έμ—μ„œ WQ 데이터셋 (small dataset)에 λŒ€ν•œ Single μ‹€ν—˜ μ°Έκ³ ν•˜λŠ” 것이 μ’‹μ•„λ³΄μž„
    • λ…Όλ¬Έμ—μ„œλŠ” Batch size 128둜 μ‹€ν—˜. 늘리면 늘릴 수둝 μ„±λŠ₯ 쒋아짐
    • End-to-end둜 ν•™μŠ΅ν•˜λŠ” 것보닀, Retriever + Reader 각각 ν•™μŠ΅ν•˜λŠ” 것이 μ„±λŠ₯ μ’‹μ•˜μŒ
  • T-5λŠ” Generative model인데, Extractive QA task도 κ°€λŠ₯

  • Elastic Search μ μš©ν•˜λŠ” 것도 μ’‹μ•„λ³΄μž„ (μ˜€ν”ΌμŠ€μ•„μ›Œλ•Œ μ‹€μ œλ‘œ μ μš©ν•œλ‹€λŠ” Hint)

  • Generative & Extractive λͺ¨λΈμ˜ 앙상블이 κ°€λŠ₯ν•œκ°€? -> 생각해봐야함