인문정보편찬연구II_22 - Esantomi/digital-humanities GitHub Wiki

목차

강의 계획서

image

강의 페이지

시험 방법

  • 20분간 미니학술대회를 개최, 이것으로써 기말평가를 실시
    • 일시 : 22/12/16
    • 본인 주제에 대한 데이터 네트워크를 구축하고, 이를 활용하여 스토리를 탐구한 것을 발표
    • 2인까지 공동발표 가능
      • 리포팅은 따로
      • 본인 기여 부분 등 명시

1주차. 전산화, 디지털화, 디지털 전환

  • 전산화, 디지털화, 디지털 전환
    • 전산화(Digitization)
      • 객체의 물리적인 형상이나 속성이 디지털 신호로 표현될 수 있도록 하는 것
      • 예) 백과사전 텍스트 전산 입력 / 아카이브 물품의 디지털 사본 제작
    • 디지털화(Digitalization)
      • 전산화(Digitization)의 결과를 활용하여 예전부터 해 오던 일의 프로세스를 디지털 기반으로 효율화하는 것
      • 예) 백과사전/아카이브 콘텐츠의 온라인 서비스 / 데이터 관리 시스템 운영
    • 디지털 전환(Digital Transformation)
      • 디지털 기술에 의해 확장된 지평 위에서 프로세스 자체를 변화시키는 것
      • 아울러 그 새로운 프로세스가 작동하도록 옛것에 매이는 고정관념을 깨뜨리고, 조직과 문화를 개선하는 것
      • 예) 백과사전과 아카이브의 구획을 넘어서는 ‘백과사전적 아카이브’의 구현
    • 출처 : 김현;강혜원, 「고고학술정보 데이터 아카이빙 전략과 구현 방안」
  • 『한국민족문화대백과사전』
    • 백과사전의 출판·보급과 지속적 내용 증보 등의 업무를 컴퓨터 시스템상에서 이루어지게 한, 이른바 디지털화(Digitalization) 단계에 해당

2주차는 추석 연휴로 인한 휴강

3주차. 데이터 구축과 데이터 비평

  • 데이터베이스 구축
    1. 데이터 그 자체에 대한 이해
      • 도메인 지식
    2. 데이터가 어떻게 사용될 것인지 고려
      • 이용할 대상이 누구인지 고려한 뒤에야 제대로 된 데이터베이스 구축이 가능함
    3. 현실적인 제약 조건이 어떻게 되는지 고려
      • 어느 정도의 시간, 인력, 기술적 역량을 투입할 수 있는가
  • 데이터 비평(data criticism)
    • 기존 데이터를 가져올 때는 그 데이터 본연의 성격을 충분히 이해할 필요가 있음
      • 전통적 학술 활동이 문헌 비평(각주 포함)를 전제하듯, 데이터를 다룰 때 역시 데이터 비평이 필요
    • 우리는 구할 수 있는 데이터 범주 내에서 설명할 수 있을 뿐 (전근대 데이터는 부분적으로만 잔존)

4주차. 스토리텔링/시맨틱 데이터

시맨틱 데이터 아카이브

  • 시맨틱 데이터 아카이브(Semantic Data Archive)
    • 대상 객체의 개별적인 속성 정보뿐 아니라 객체와 객체 사이의 관계에 대한 정보를 데이터로 기록함으로써 대상 정보의 의미적 맥락을 파악할 수 있게 하는 지식 데이터 아카이브
    • 문화재, 인물, 장소, 사건, 문헌, 개념 등의 데이터를 개별 정보 요소로 파악하기보다는 그것이 어떠한 역사적•문화적 맥락 속에 있는지를 명시적으로 보임으로써 그 요소와 맥락 정보를 활용한 ‘디지털 스토리텔링’이 이루어질 수 있게 한다.
  • 온톨로지(Ontology)
    • 시맨틱 데이터를 만들기 위해서 가장 먼저 해야 할 일은 그 데이터를 담을 수 있는 틀을 설계하는 일이다. 이것을 온톨로지(Ontology)라고 한다.
      • ‘온톨로지’란 정보화의 대상이 되는 세계를 전자적으로 표현할 수 있도록 구성한 데이터 기술 체계이다.
    • 시맨틱 데이터를 생성하는 온톨로지는 정보 요소의 ‘유형’(class)과 ‘속성’(attribute)을 정의할 뿐 아니라, 그 요소들이 다른 요소들과 맺는 ‘관계’(relation)를 명시적으로 기술할 수 있도록 하고 있다.
      image

EKC 데이터 모델

  • EKC(Encyves of Korean Culture) 데이터 모델
    • 한국의 전통문화 속의 역사적 사실 관계 및 그 사실의 문헌적 근거에 관한 지식을 데이터화하기 위해 개발한 온톨로지 스키마이다.
      • 한국학중앙연구원 디지털인문학연구소에서 2016년에 처음 제정하고, 매년 확장해 오고 있다.
    • EKC 모델의 여섯 데이터 섹션
      image
  • 스토리텔링 데이터(Storytelling Data)
    • 스토리텔링 데이터는 아카이브 속의 특정 데이터를 가지고 큐레이션의 줄거리(Storyline)를 만들어서 고객에게 ‘이야기’(Storytelling)를 제공하는 데이터이다.
    • ‘사실과 문맥 데이터’에는 ‘다양한 관점’에서 서로 관계가 있다고 판단된 많은 정보들이 포함된다.
      • 그 가운데 ‘특정한 관점’에서 일련의 데이터를 엮어서 이론이나 이야기를 표현하고자 할 경우, ‘사실과 문맥 데이터’의 특정 노드들을 선택적으로 재이용(reuse)하는 스토리텔링 데이터를 만들 수 있다.
      • 스토리텔링 데이터를 만들면서 스토리텔링의 요소로서 시맨틱 데이터를 만들어 보완하는 것!
  • 스토리텔링/시맨틱 데이터 예시
    • S2022-R1-41 : 단명한 어린 세자, 문효세자의 창덕궁
    • 스토리 데이터 내 관계
      <!--
      #Links
      S2022-R1-41 	E2022-R1-41A hasPart
      S2022-R1-41 	E2022-R1-41B hasPart
      S2022-R1-41 	E2022-R1-41C hasPart
      S2022-R1-41 	E2022-R1-41D hasPart
      
      #End
      -->
      
    • 시맨틱 데이터 내 관계
      ===Contextual Relations===
      
      {|class="wikitable" style="width:54%"
      ! source || target || relation || attribute || note
      |-
      | [S2022-R1-41]] 	](/Esantomi/digital-humanities/wiki/|-[[E2022-R1-41A) 	|| [hasPart](/Esantomi/digital-humanities/wiki/hasPart) || || 정조의 기쁨, 문효세자의 탄생
      |-
      | [S2022-R1-41]] 	](/Esantomi/digital-humanities/wiki/|-[[E2022-R1-41B) 	|| [hasPart](/Esantomi/digital-humanities/wiki/hasPart) || || 문효세자와 스승 보양관의 첫 만남
      |-
      | [S2022-R1-41]] 	](/Esantomi/digital-humanities/wiki/|-[[E2022-R1-41C) 	|| [hasPart](/Esantomi/digital-humanities/wiki/hasPart) || || 생후 22개월에 왕세자가 된 문효세자
      |-
      | [S2022-R1-41]] 	](/Esantomi/digital-humanities/wiki/|-[[E2022-R1-41D) 	|| [hasPart](/Esantomi/digital-humanities/wiki/hasPart) || || 문효세자, 만 3세에 단명하다
      |-
      | [E2022-R1-41A]] 	](/Esantomi/digital-humanities/wiki/|-[[E2022-R1-41B) 	|| [isPreviousInSequenceTo](/Esantomi/digital-humanities/wiki/isPreviousInSequenceTo) || || 
      |-
      | [E2022-R1-41B]] 	](/Esantomi/digital-humanities/wiki/|-[[E2022-R1-41C) 	|| [isPreviousInSequenceTo](/Esantomi/digital-humanities/wiki/isPreviousInSequenceTo) || || 
      |-
      | [E2022-R1-41C]] 	](/Esantomi/digital-humanities/wiki/|-[[E2022-R1-41D) 	|| [isPreviousInSequenceTo](/Esantomi/digital-humanities/wiki/isPreviousInSequenceTo) || || 
      |-
      |}
      
      * [Ontology:EKC 2022:Relation](/Esantomi/digital-humanities/wiki/Ontology:EKC-2022:Relation)
      

과제

  • 스토리텔링 데이터 구축해 보기

5주차. 광주 문화예술 인문스토리

광주 문화예술 인문스토리

RDF

  • RDF(Resource Description Framework)
    image
    • Resource
      • 자원은 ‘웹상에 존재하는 모든 것’을 의미함 (즉, 웹 안에 있는 모든 자료들을 의미함)
        • 이것이 추상적인 개념(intangible)일지라도 자원이라 부름
      • 이러한 자원은 온톨로지(Ontology)에서 Entity로 표현됨
    • Description
      • 자원을 ‘기술’한다는 것의 의미?
      • 자원은 Attributes와 Relationships로 표현됨
      • 즉, Entity가 가지는 특성이 Attributes로 표현되고, Entity와 Entity 사이의 관계를 표현하는 것이 Relationships
    • Framework
      • 프레임워크는 공학적 언어로 표현된 Resource Description을 기계가 읽고 이해할 수 있는 방식으로 구조를 제공한다는 것
      • 첫 번째로 이 프레임워크는 Graph 구조를 따름
        • node와 edge로 구성된 그래프이나 ① 방향성이 존재하고(directed) ② 방향에 의미가 붙여진(labeled) 그래프 구조를 사용함
      • 두 번째로 데이터 모델을 읽어 들일 수 있는 언어(languages)가 필요하고, 이 언어를 위해 문법(syntax)이 존재함
    • 참고 : [Knowledge Graph] 1. What is RDF? RDF란 무엇인가?

과제

  • 하던 과업 다 마무리 짓고 엑셀로 작성해서 이 선생님께 제출
    • 2022 한양도성 3D건축물 worksheet.xlsx 제출 완료

6주차 휴강

7주차. 노드-릴레이션 피드백

8주차. 한양도성 사업 피드백 (1)

  • 모든 데이터는 주관적이다.
    • 데이터를 선별한다는 것부터가 연구자의 주관적 판단에 따른 것
  • 한국 최초의 크리스마스 씰 도안은 원래 거북선이었으나 일제의 검열로 인해 불발됨

9주차. 한양도성 사업 피드백 (2)

    • 以文會友 以友輔仁(이문회우 이우보인)
      • 논어(論語) 안연(顔淵)편
    • 文質彬彬(문질빈빈)
      • 논어(論語) 옹야(雍也)편
    • 文化!!
  • 2022 KADH(11/5)
    • 줌(Zoom), 커피 콘서트 오디오 세팅 완료할 것

10주차. 한양도성 사업 피드백 (3)

과제

  • 데이터 링크 리스트 작성 후 카톡 올리기
  • 11/28 최종 데이터 제출

11주차. 한양도성 사업 피드백 (4)

  • 야간 응급실 행으로 인한 결석
  • 서버 데이터베이스에 데이터 업로드하기

12주차. 한양도성 사업 피드백 (5)

  • 전거 통제(典據統制, Authority control)
    • 정의
      • 문헌정보학에서 도서 목록이나 서지 자료의 표목으로 사용되는 이름, 주제, 표제 등을 일관성 있게 채택하도록 관리하는 기법
      • In information science, authority control is a process that organizes information, for example in library catalogs, by using a single, distinct spelling of a name (heading) or a numeric identifier for each topic.
    • 예시

과제

  • 동궐도 tif 파일 참고해서 Architecture 노드 attribute 컬럼에 동궐도 첩-면-건물번호 기입 작업하기 (e.g. 함인정: 06-04-13)

13주차. 한양도성 데이터 DB 업로드 및 검토

  • 디지털인문학?
    • 빅데이터
    • 크라우드소싱
      • 나 혼자는 할 수 없다. 공동의 자산에 대해 공동의 노력을 기울여야 함
      • 어떻게 협업을 할 것인가? 훈련받은 개인은 부품의 역할만 수행. 그러나 근대 이래 공교육은 이에 집중함
    • 문외한들의 트집에 주눅 들 필요 없음
      • 프로젝트는 돈벌이를 위해 하고, 연구는 개인이 책을 보고 하는 것?
      • 프로젝트 결과물이 곧 연구에 직결될 수 있음!

결과물 및 DB 업로드

  • 2022한양도성_시맨틱데이터_인문정보학_종합_221202_v6(최종버전).xlsx
    image
  • 데이터 검토 및 수정용 SQL 문
    /* 인문정보편찬연구II (22.12.02) */
    
    USE hanyang2022
    
    
    --DecNode 조회
    select * from DecNode$
    
    select * from DecNode$
    	where 최종수정id is NULL
    
    --최종수정 id 중복 확인용
    select distinct 최종수정id from DecNode$
    
    select 최종수정id, count(*) from DecNode$
    	group by 최종수정id
    	having count(*) > 1
    
    select * from DecNode$
    	where 최종수정id='E2022-R2-09B'
    
    --중복 데이터 삭제
    /*
    delete DecNode$
    	where 최종수정id='E2022-R2-09B'
    	and iconUrl='http://dh.aks.ac.kr/~hanyang2/icon/episode.png'
    */
    
    
    --node2022Dec02 조회
    select * from node2022Dec02$
    
    select * from node2022Dec02$
    	where id is NULL
    
    --id, class, label 중 NULL 값이 있는지 조회
    select * from node2022Dec02$
    	where id is NULL or class is NULL or label is NULL
    
    --NULL 값 수정
    update Node2022Dec02$
    	set class='Actor', groupName ='인물군'
    	where id='장생보연지무동'
    
    update Node2022Dec02$
    	set label='정순왕후'
    	where id='정순왕후'
    
    select distinct groupName from hanyang2022Data
    	where class='Actor'
    
    --join 문
    select a.* from Node2022Dec02$ as a
    	join hanyang2022Data as b
    	on a.id=b.id
    
    --left join 문
    select a.* from Node2022Dec02$ as a
    	left join hanyang2022Data as b
    	on a.id=b.id
    
    --insert 문
    /*
    insert hanyang2022Data
    	select a.* from Node2022Dec02$ as a
      		left join hanyang2022Data as b
      		on a.id=b.id
      		where b.id is NULL
    */
    
    
    --hanyang2022Links 조회
    select * from hanyang2022Links
    
    select * from hanyang2022Links as a
    	join Delete2022Dec02$ as b
    	on a.source=b.source and a.target=b.target and a.relation=b.relation
    
    --delete문
    /*
    delete hanyang2022Links
    	from hanyang2022Links as a
    	join Delete2022Dec02$ as b
    	on a.source=b.source and a.target=b.target and a.relation=b.relation
    */
    
    
    --Link2022Dec02 조회
    select * from Link2022Dec02$
    
    select source, target, relation, count(*) from Link2022Dec02$
    	group by source, target, relation
    	having count(*) > 1
    
    --제거대상 view 생성
    create view 제거대상 as
    	select source, target, relation, count(*) as occurence from Link2022Dec02$
    	group by source, target, relation
    	having count(*) > 1
    
    select * from 제거대상
    
    --delete 문
    /*
    delete Link2022Dec02$
    	select a.* from Link2022Dec02$ as a
      		join hanyang2022Links as b
      		on a.source=b.source and a.target=b.target and a.relation=b.relation
    */
    
    select * from Link2022Dec02$
    
    select source, target, relation, count(*) as occurence from Link2022Dec02$
    	group by source, target, relation
    	having count(*) > 1
    
    select * from Link2022Dec02$ as a
    	join 제거대상 as b
    	on a.source=b.source and a.target=b.target and a.relation=b.relation
    
    /*
    delete Link2022Dec02$
    	select * from Link2022Dec02$ as a
      		join 제거대상 as b
      		on a.source=b.source and a.target=b.target and a.relation=b.relation
    */
    
    select * from 제거대상
    
    --제거대상 view 제거
    drop view 제거대상
    
    --insert 문
    insert into hanyang2022Links
    	select * from Link2022Dec02$
    
    
    --한양 노드 조회
    select * from hanyang2022Data
    
    --한양 릴레이션 조회
    select * from hanyang2022Links
    

과제

  • 스토리 제작 및 DB 업로드 (네트워크로 볼 수 있도록)

14주차.

광주 문화예술 인문스토리 플랫폼

  • 광주 문화예술 인문스토리 플랫폼
    • 광주광역시에 산재한 문화예술자료와 근현대문화유적(1940년 이후, 역사의 격변기를 살아온 광주 시민들의 생활과 문화의 흔적을 담고 있는 문화재와 미래유산)을 발굴 및 기록하는 디지털 데이터 아카이브
    • 정보 객체의 개별적인 속성 정보뿐 아나라 객체와 객체 사이의 관계 정보를 데이터로 기록함으로써 대상 정보의 의미적 맥락을 파악할 수 있게 하는 시맨틱(의미 기반) 데이터베이스
    • 글과 데이터로 표현되는 정보뿐 아니라 다양한 2D, 3D 어셋을 제공하고, 이를 자유롭게 활용토록 함으로써 새로운 디지털 콘텐츠의 창작을 촉진하는 디지털 어셋 공유 플랫폼
    • 가치와 의미를 지닌 데이터 세계에서 자신의 흥밋거리를 발견하고 호기심을 유발하여 자유롭게 자신의 이야기를 만들어가도록 하여, 주체적으로 지식 체계를 설계하는 미래세대(디지털 원어민)와 소통 가능한 디지털 스토리텔링 플랫폼
  • 광주 3D 메타버스
    image

업무

  • 2022 시맨틱 데이터 검색에서 photoalbum:창덕궁:진선문을 검색했을 때 'dh.aks.ac.kr에서 연결을 거부했습니다' 오류가 뜨는 경우가 있음. 문제 없이 잘 되는 사람도 있으니 개별 브라우저 세팅의 문제인 듯한데 진단 필요!
    • chrome://flags/의 strict site isolation 옵션은 없어짐
    • iframe 에 페이지가 뜨지 않는 경우 X-Frame-Options 참고!
      • 개발자 도구로 확인한 결과, Refused to display 'http://dh.aks.ac.kr/' in a frame chrome-error://chromewebdata/:1 because it set 'X-Frame-Options' to 'deny'라는 메시지가 뜨는 것을 확인함
      • X-Frame-Options는 iframe 태그 등에서 외부 참조가 가능 또는 불가능하게 설정할 수 있는 통신 설정
      • 이 설정은 서버 관리자에 의해 변경이 가능함
        • 아파치 웹 서버 기준 /etc/apache2/conf-available/security.conf 경로의 conf 파일에서 Header set X-Frame-Options 값을 변경해 주면 됨
      • 왜 일부 인원에 대해서만 이런 문제가 발생하는지는 파악하지 못함
      • 개개인은 Ignore X-Frame headers라는 chrome extension을 설치하여 문제를 우회할 수 있음

15주차. 주니어 학술대회