인문정보편찬연구II_22 - Esantomi/digital-humanities GitHub Wiki
목차
- 1주차. 전산화, 디지털화, 디지털 전환
- 3주차. 데이터 구축과 데이터 비평
- 4주차. 스토리텔링/시맨틱 데이터
- 5주차. 광주 문화예술 인문스토리
- 7주차. 노드-릴레이션 피드백
- 8주차. 한양도성 사업 피드백 (1)
- 9주차. 한양도성 사업 피드백 (2)
- 10주차. 한양도성 사업 피드백 (3)
- 11주차. 한양도성 사업 피드백 (4)
- 12주차. 한양도성 사업 피드백 (5)
- 13주차. 한양도성 데이터 DB 업로드 및 검토
- 14주차.
- 15주차. 주니어 학술대회
강의 계획서
강의 페이지
시험 방법
- 20분간 미니학술대회를 개최, 이것으로써 기말평가를 실시
1주차. 전산화, 디지털화, 디지털 전환
- 전산화, 디지털화, 디지털 전환
- 전산화(Digitization)
- 객체의 물리적인 형상이나 속성이 디지털 신호로 표현될 수 있도록 하는 것
예) 백과사전 텍스트 전산 입력 / 아카이브 물품의 디지털 사본 제작
- 디지털화(Digitalization)
- 전산화(Digitization)의 결과를 활용하여 예전부터 해 오던 일의 프로세스를 디지털 기반으로 효율화하는 것
예) 백과사전/아카이브 콘텐츠의 온라인 서비스 / 데이터 관리 시스템 운영
- 디지털 전환(Digital Transformation)
- 디지털 기술에 의해 확장된 지평 위에서 프로세스 자체를 변화시키는 것
- 아울러 그 새로운 프로세스가 작동하도록 옛것에 매이는 고정관념을 깨뜨리고, 조직과 문화를 개선하는 것
예) 백과사전과 아카이브의 구획을 넘어서는 ‘백과사전적 아카이브’의 구현
- 출처 : 김현;강혜원, 「고고학술정보 데이터 아카이빙 전략과 구현 방안」
- 전산화(Digitization)
- 『한국민족문화대백과사전』
- 백과사전의 출판·보급과 지속적 내용 증보 등의 업무를 컴퓨터 시스템상에서 이루어지게 한, 이른바 디지털화(Digitalization) 단계에 해당
2주차는 추석 연휴로 인한 휴강
3주차. 데이터 구축과 데이터 비평
- 데이터베이스 구축
- 데이터 그 자체에 대한 이해
- 도메인 지식
- 데이터가 어떻게 사용될 것인지 고려
- 이용할 대상이 누구인지 고려한 뒤에야 제대로 된 데이터베이스 구축이 가능함
- 현실적인 제약 조건이 어떻게 되는지 고려
- 어느 정도의 시간, 인력, 기술적 역량을 투입할 수 있는가
- 데이터 그 자체에 대한 이해
- 데이터 비평(data criticism)
- 기존 데이터를 가져올 때는 그 데이터 본연의 성격을 충분히 이해할 필요가 있음
- 전통적 학술 활동이 문헌 비평(각주 포함)를 전제하듯, 데이터를 다룰 때 역시 데이터 비평이 필요
- 우리는 구할 수 있는 데이터 범주 내에서 설명할 수 있을 뿐 (전근대 데이터는 부분적으로만 잔존)
- 기존 데이터를 가져올 때는 그 데이터 본연의 성격을 충분히 이해할 필요가 있음
4주차. 스토리텔링/시맨틱 데이터
시맨틱 데이터 아카이브
- 시맨틱 데이터 아카이브(Semantic Data Archive)
- 대상 객체의 개별적인 속성 정보뿐 아니라 객체와 객체 사이의 관계에 대한 정보를 데이터로 기록함으로써 대상 정보의 의미적 맥락을 파악할 수 있게 하는 지식 데이터 아카이브
- 문화재, 인물, 장소, 사건, 문헌, 개념 등의 데이터를 개별 정보 요소로 파악하기보다는 그것이 어떠한 역사적•문화적 맥락 속에 있는지를 명시적으로 보임으로써 그 요소와 맥락 정보를 활용한 ‘디지털 스토리텔링’이 이루어질 수 있게 한다.
- 온톨로지(Ontology)
- 시맨틱 데이터를 만들기 위해서 가장 먼저 해야 할 일은 그 데이터를 담을 수 있는 틀을 설계하는 일이다. 이것을 온톨로지(Ontology)라고 한다.
- ‘온톨로지’란 정보화의 대상이 되는 세계를 전자적으로 표현할 수 있도록 구성한 데이터 기술 체계이다.
- 시맨틱 데이터를 생성하는 온톨로지는 정보 요소의 ‘유형’(class)과 ‘속성’(attribute)을 정의할 뿐 아니라, 그 요소들이 다른 요소들과 맺는 ‘관계’(relation)를 명시적으로 기술할 수 있도록 하고 있다.
- 시맨틱 데이터를 만들기 위해서 가장 먼저 해야 할 일은 그 데이터를 담을 수 있는 틀을 설계하는 일이다. 이것을 온톨로지(Ontology)라고 한다.
EKC 데이터 모델
- EKC(Encyves of Korean Culture) 데이터 모델
- 한국의 전통문화 속의 역사적 사실 관계 및 그 사실의 문헌적 근거에 관한 지식을 데이터화하기 위해 개발한 온톨로지 스키마이다.
- 한국학중앙연구원 디지털인문학연구소에서 2016년에 처음 제정하고, 매년 확장해 오고 있다.
- EKC 모델의 여섯 데이터 섹션
- 출처 : 김현;강혜원, 「고고학술정보 데이터 아카이빙 전략과 구현 방안」
- 한국의 전통문화 속의 역사적 사실 관계 및 그 사실의 문헌적 근거에 관한 지식을 데이터화하기 위해 개발한 온톨로지 스키마이다.
- 스토리텔링 데이터(Storytelling Data)
- 스토리텔링 데이터는 아카이브 속의 특정 데이터를 가지고 큐레이션의 줄거리(Storyline)를 만들어서 고객에게 ‘이야기’(Storytelling)를 제공하는 데이터이다.
- ‘사실과 문맥 데이터’에는 ‘다양한 관점’에서 서로 관계가 있다고 판단된 많은 정보들이 포함된다.
- 그 가운데 ‘특정한 관점’에서 일련의 데이터를 엮어서 이론이나 이야기를 표현하고자 할 경우, ‘사실과 문맥 데이터’의 특정 노드들을 선택적으로 재이용(reuse)하는 스토리텔링 데이터를 만들 수 있다.
- 스토리텔링 데이터를 만들면서 스토리텔링의 요소로서 시맨틱 데이터를 만들어 보완하는 것!
- 스토리텔링/시맨틱 데이터 예시
- S2022-R1-41 : 단명한 어린 세자, 문효세자의 창덕궁
- 스토리 데이터 내 관계
<!-- #Links S2022-R1-41 E2022-R1-41A hasPart S2022-R1-41 E2022-R1-41B hasPart S2022-R1-41 E2022-R1-41C hasPart S2022-R1-41 E2022-R1-41D hasPart #End -->
- 시맨틱 데이터 내 관계
===Contextual Relations=== {|class="wikitable" style="width:54%" ! source || target || relation || attribute || note |- | [S2022-R1-41]] ](/Esantomi/digital-humanities/wiki/|-[[E2022-R1-41A) || [hasPart](/Esantomi/digital-humanities/wiki/hasPart) || || 정조의 기쁨, 문효세자의 탄생 |- | [S2022-R1-41]] ](/Esantomi/digital-humanities/wiki/|-[[E2022-R1-41B) || [hasPart](/Esantomi/digital-humanities/wiki/hasPart) || || 문효세자와 스승 보양관의 첫 만남 |- | [S2022-R1-41]] ](/Esantomi/digital-humanities/wiki/|-[[E2022-R1-41C) || [hasPart](/Esantomi/digital-humanities/wiki/hasPart) || || 생후 22개월에 왕세자가 된 문효세자 |- | [S2022-R1-41]] ](/Esantomi/digital-humanities/wiki/|-[[E2022-R1-41D) || [hasPart](/Esantomi/digital-humanities/wiki/hasPart) || || 문효세자, 만 3세에 단명하다 |- | [E2022-R1-41A]] ](/Esantomi/digital-humanities/wiki/|-[[E2022-R1-41B) || [isPreviousInSequenceTo](/Esantomi/digital-humanities/wiki/isPreviousInSequenceTo) || || |- | [E2022-R1-41B]] ](/Esantomi/digital-humanities/wiki/|-[[E2022-R1-41C) || [isPreviousInSequenceTo](/Esantomi/digital-humanities/wiki/isPreviousInSequenceTo) || || |- | [E2022-R1-41C]] ](/Esantomi/digital-humanities/wiki/|-[[E2022-R1-41D) || [isPreviousInSequenceTo](/Esantomi/digital-humanities/wiki/isPreviousInSequenceTo) || || |- |} * [Ontology:EKC 2022:Relation](/Esantomi/digital-humanities/wiki/Ontology:EKC-2022:Relation)
과제
- 스토리텔링 데이터 구축해 보기
5주차. 광주 문화예술 인문스토리
광주 문화예술 인문스토리
- 광주 문화예술 인문스토리 플랫폼
- 예시 : 용전들노래
RDF
- RDF(Resource Description Framework)
- Resource
- 자원은 ‘웹상에 존재하는 모든 것’을 의미함 (즉, 웹 안에 있는 모든 자료들을 의미함)
- 이것이 추상적인 개념(intangible)일지라도 자원이라 부름
- 이러한 자원은 온톨로지(Ontology)에서 Entity로 표현됨
- 자원은 ‘웹상에 존재하는 모든 것’을 의미함 (즉, 웹 안에 있는 모든 자료들을 의미함)
- Description
- 자원을 ‘기술’한다는 것의 의미?
- 자원은 Attributes와 Relationships로 표현됨
- 즉, Entity가 가지는 특성이 Attributes로 표현되고, Entity와 Entity 사이의 관계를 표현하는 것이 Relationships
- Framework
- 프레임워크는 공학적 언어로 표현된 Resource Description을 기계가 읽고 이해할 수 있는 방식으로 구조를 제공한다는 것
- 첫 번째로 이 프레임워크는 Graph 구조를 따름
- node와 edge로 구성된 그래프이나 ① 방향성이 존재하고(directed) ② 방향에 의미가 붙여진(labeled) 그래프 구조를 사용함
- 두 번째로 데이터 모델을 읽어 들일 수 있는 언어(languages)가 필요하고, 이 언어를 위해 문법(syntax)이 존재함
- 참고 : [Knowledge Graph] 1. What is RDF? RDF란 무엇인가?
- Resource
과제
- 하던 과업 다 마무리 짓고 엑셀로 작성해서 이 선생님께 제출
2022 한양도성 3D건축물 worksheet.xlsx
제출 완료
6주차 휴강
7주차. 노드-릴레이션 피드백
isNear
는 쓰지 말 것 (어차피 권역별로 묶임)- 가상재현물로 체험하는 1848년 창경궁 통명전에서의 야진찬
8주차. 한양도성 사업 피드백 (1)
- 모든 데이터는 주관적이다.
- 데이터를 선별한다는 것부터가 연구자의 주관적 판단에 따른 것
- 한국 최초의 크리스마스 씰 도안은 원래 거북선이었으나 일제의 검열로 인해 불발됨
9주차. 한양도성 사업 피드백 (2)
- 文
以文會友 以友輔仁
(이문회우 이우보인)- 논어(論語) 안연(顔淵)편
文質彬彬
(문질빈빈)- 논어(論語) 옹야(雍也)편
- 文化!!
- 2022 KADH(11/5)
- 줌(Zoom), 커피 콘서트 오디오 세팅 완료할 것
10주차. 한양도성 사업 피드백 (3)
- 기말평가에 대한 안내
오월_어머니의_노래 5.18민주화운동 hasHistoricalSetting
- hasHistoricalSetting 대신 depicts도 가능
- 오월 어머니의 노래
과제
- 데이터 링크 리스트 작성 후 카톡 올리기
- 11/28 최종 데이터 제출
11주차. 한양도성 사업 피드백 (4)
- 야간 응급실 행으로 인한 결석
- 서버 데이터베이스에 데이터 업로드하기
12주차. 한양도성 사업 피드백 (5)
- 전거 통제(典據統制, Authority control)
- 정의
- 문헌정보학에서 도서 목록이나 서지 자료의 표목으로 사용되는 이름, 주제, 표제 등을 일관성 있게 채택하도록 관리하는 기법
- In information science, authority control is a process that organizes information, for example in library catalogs, by using a single, distinct spelling of a name (heading) or a numeric identifier for each topic.
- 예시
- 정의
과제
- 동궐도 tif 파일 참고해서 Architecture 노드 attribute 컬럼에 동궐도 첩-면-건물번호 기입 작업하기 (e.g. 함인정: 06-04-13)
13주차. 한양도성 데이터 DB 업로드 및 검토
- 디지털인문학?
- 빅데이터
- 크라우드소싱
- 나 혼자는 할 수 없다. 공동의 자산에 대해 공동의 노력을 기울여야 함
- 어떻게 협업을 할 것인가? 훈련받은 개인은 부품의 역할만 수행. 그러나 근대 이래 공교육은 이에 집중함
- 문외한들의 트집에 주눅 들 필요 없음
- 프로젝트는 돈벌이를 위해 하고, 연구는 개인이 책을 보고 하는 것?
- 프로젝트 결과물이 곧 연구에 직결될 수 있음!
결과물 및 DB 업로드
2022한양도성_시맨틱데이터_인문정보학_종합_221202_v6(최종버전).xlsx
- 데이터 검토 및 수정용 SQL 문
/* 인문정보편찬연구II (22.12.02) */ USE hanyang2022 --DecNode 조회 select * from DecNode$ select * from DecNode$ where 최종수정id is NULL --최종수정 id 중복 확인용 select distinct 최종수정id from DecNode$ select 최종수정id, count(*) from DecNode$ group by 최종수정id having count(*) > 1 select * from DecNode$ where 최종수정id='E2022-R2-09B' --중복 데이터 삭제 /* delete DecNode$ where 최종수정id='E2022-R2-09B' and iconUrl='http://dh.aks.ac.kr/~hanyang2/icon/episode.png' */ --node2022Dec02 조회 select * from node2022Dec02$ select * from node2022Dec02$ where id is NULL --id, class, label 중 NULL 값이 있는지 조회 select * from node2022Dec02$ where id is NULL or class is NULL or label is NULL --NULL 값 수정 update Node2022Dec02$ set class='Actor', groupName ='인물군' where id='장생보연지무동' update Node2022Dec02$ set label='정순왕후' where id='정순왕후' select distinct groupName from hanyang2022Data where class='Actor' --join 문 select a.* from Node2022Dec02$ as a join hanyang2022Data as b on a.id=b.id --left join 문 select a.* from Node2022Dec02$ as a left join hanyang2022Data as b on a.id=b.id --insert 문 /* insert hanyang2022Data select a.* from Node2022Dec02$ as a left join hanyang2022Data as b on a.id=b.id where b.id is NULL */ --hanyang2022Links 조회 select * from hanyang2022Links select * from hanyang2022Links as a join Delete2022Dec02$ as b on a.source=b.source and a.target=b.target and a.relation=b.relation --delete문 /* delete hanyang2022Links from hanyang2022Links as a join Delete2022Dec02$ as b on a.source=b.source and a.target=b.target and a.relation=b.relation */ --Link2022Dec02 조회 select * from Link2022Dec02$ select source, target, relation, count(*) from Link2022Dec02$ group by source, target, relation having count(*) > 1 --제거대상 view 생성 create view 제거대상 as select source, target, relation, count(*) as occurence from Link2022Dec02$ group by source, target, relation having count(*) > 1 select * from 제거대상 --delete 문 /* delete Link2022Dec02$ select a.* from Link2022Dec02$ as a join hanyang2022Links as b on a.source=b.source and a.target=b.target and a.relation=b.relation */ select * from Link2022Dec02$ select source, target, relation, count(*) as occurence from Link2022Dec02$ group by source, target, relation having count(*) > 1 select * from Link2022Dec02$ as a join 제거대상 as b on a.source=b.source and a.target=b.target and a.relation=b.relation /* delete Link2022Dec02$ select * from Link2022Dec02$ as a join 제거대상 as b on a.source=b.source and a.target=b.target and a.relation=b.relation */ select * from 제거대상 --제거대상 view 제거 drop view 제거대상 --insert 문 insert into hanyang2022Links select * from Link2022Dec02$ --한양 노드 조회 select * from hanyang2022Data --한양 릴레이션 조회 select * from hanyang2022Links
과제
- 스토리 제작 및 DB 업로드 (네트워크로 볼 수 있도록)
14주차.
광주 문화예술 인문스토리 플랫폼
- 광주 문화예술 인문스토리 플랫폼
- 광주광역시에 산재한 문화예술자료와 근현대문화유적(1940년 이후, 역사의 격변기를 살아온 광주 시민들의 생활과 문화의 흔적을 담고 있는 문화재와 미래유산)을 발굴 및 기록하는 디지털 데이터 아카이브
- 정보 객체의 개별적인 속성 정보뿐 아나라 객체와 객체 사이의 관계 정보를 데이터로 기록함으로써 대상 정보의 의미적 맥락을 파악할 수 있게 하는 시맨틱(의미 기반) 데이터베이스
- 글과 데이터로 표현되는 정보뿐 아니라 다양한 2D, 3D 어셋을 제공하고, 이를 자유롭게 활용토록 함으로써 새로운 디지털 콘텐츠의 창작을 촉진하는 디지털 어셋 공유 플랫폼
- 가치와 의미를 지닌 데이터 세계에서 자신의 흥밋거리를 발견하고 호기심을 유발하여 자유롭게 자신의 이야기를 만들어가도록 하여, 주체적으로 지식 체계를 설계하는 미래세대(디지털 원어민)와 소통 가능한 디지털 스토리텔링 플랫폼
- 광주 3D 메타버스
업무
- 2022 시맨틱 데이터 검색에서
photoalbum:창덕궁:진선문
을 검색했을 때 'dh.aks.ac.kr에서 연결을 거부했습니다
' 오류가 뜨는 경우가 있음. 문제 없이 잘 되는 사람도 있으니 개별 브라우저 세팅의 문제인 듯한데 진단 필요!chrome://flags/
의 strict site isolation 옵션은 없어짐- iframe 에 페이지가 뜨지 않는 경우 X-Frame-Options 참고!
- 개발자 도구로 확인한 결과,
Refused to display 'http://dh.aks.ac.kr/' in a frame chrome-error://chromewebdata/:1 because it set 'X-Frame-Options' to 'deny'
라는 메시지가 뜨는 것을 확인함 - X-Frame-Options는 iframe 태그 등에서 외부 참조가 가능 또는 불가능하게 설정할 수 있는 통신 설정
- 이 설정은 서버 관리자에 의해 변경이 가능함
- 아파치 웹 서버 기준
/etc/apache2/conf-available/security.conf
경로의 conf 파일에서Header set X-Frame-Options
값을 변경해 주면 됨
- 아파치 웹 서버 기준
- 왜 일부 인원에 대해서만 이런 문제가 발생하는지는 파악하지 못함
- 개개인은 Ignore X-Frame headers라는 chrome extension을 설치하여 문제를 우회할 수 있음
- 개발자 도구로 확인한 결과,