DB구축비 중 작업요소에 대한 설명

 용어설명
<현대간행물 데이터베이스구축 관련 용어>
– 메타데이터 : 데이터를 설명해 주는 데이터
– DTD(Document Type DefinitionZ) : 표준 범용 문서 생성 언어 규약에 근거한 전자문서를 구성하는 세 부분 중의 하나로, 태그의 이름, 계층 구조 및 속성 등이 정의됨
– TOC 정보 : 도서의 목차와 본문을 연계하는 정보

<고전적자료 데이터베이스구축 관련 용어>
– 이체자(異體字) : 정자(正字)와 의미는 같으나 자형이 다른 한자
– 신출자 : 유니코드 Super CJK 7만여자 범위외 한자
– 해서체 : 글자의 획이 뚜렷한 한자
– 행서체 : 글자의 부분 획이 흘려 씌여진 한자
– 초서체 : 글자의 전체 획이 흘려 씌여진 한자
– 탈초 : 초서체 및 행서체 고전적자료를 판독하는 작업
초서 필사본 원본의 해독을 의미하나, 일반적으로 읽기 어려운 초서, 그리고 필사체로 된 한문이나 한글, 일본어등을 읽기 쉽게 정서하는 것을 통칭함.
– 이미지 군집화 : 낱자단위로 분리된 글자의 이미지를 추출하여 일정한 상관과 공통성에 따라 유사한 이미지별로 모으는 작업
– 일자대조 : 글자이미지를 군집화하여 교정하거나 글자이미지와 입력된 글자를 병렬시켜 글자 하나하나를 직접 비교 대조하여 교정하는 작업
– 축자대조 : 입력 파일을 출력하고 낱자단위로 원본의 글귀대로 대조하여 교정하는 작업
– 간략해제 : 도서 및 문헌 등에 대하여 형태적․내용적인 특징을 간략하게 기술한 글

※ 위 설명은 본 대가 기준을 이해하는 데에 도움이 되기 위한 목적으로 작성된 것이며, 사전적인 용어 정의와는 다를 수 있음.

특수작업요소
① 자료분석
– 표점 : 한문자료에 띄어쓰기나 구두점을 표기하는 작업
– 기사제목추출 : 도서에서 기사단위를 식별하여 기사의 제목을 추출하는 작업
– 탈초 : 초서체 및 행서체 고전적자료를 판독하는 작업

② 메타데이터 제작
– 서지(書誌) 작성 및 검증 : 도서 및 문헌 등의 형태적인 특징을 메타데이터요소로 추출하고 검증하는 작업
– 해제(解題) 작성 및 검증 : 도서 및 문헌 등의 형태적인 특징과 내용적인 특징을 문장으로 기술하고 검증하는 작업

③ 색인
– 색인 : 기사단위를 중심으로 기사가 가지고 있는 중요어휘들을 추출하는 작업
– 색인어 태깅 : 원문으로부터 추출한 색인(인명, 지명, 관직명 등)에 색인임을 표시하는 작업

④ 교열 및 교감
– 교열 : 문맥을 고려하여 글자의 오류를 수정하는 작업
– 윤문 : 어색한 문장을 수정하거나, 보다 매끄러운 문장으로 만드는 작업
– 교감 : 도서 및 문헌 등의 계통을 고려하고 해당 분야의 학문적 성과에 근거하여 글자나 문장의 오류를 수정하는 작업

출처 : http://www.kdb.or.kr/info/info_02_04.php?field=&keyword=&page=11&dbnum=40&mode=detail&type=price

Leave a Reply

Your email address will not be published. Required fields are marked *