지리지 XML 정규화 개발 문서 원본 보기
←
지리지 XML 정규화 개발
둘러보기로 이동
검색으로 이동
문서 편집 권한이 없습니다. 다음 이유를 확인해주세요:
요청한 명령은 다음 권한을 가진 사용자에게 제한됩니다:
사용자
.
문서의 원본을 보거나 복사할 수 있습니다.
[[파일:기술_지리지_XML.jpg|섬네일|300픽셀|기술_지리지_XML_비교]] == 기술 개요 == * 기술 설명 ** 고전번역원, 국사편찬위원회에서 작성된 주요 지리지 XML DB 처리 모듈 ** 특정 필드 자동 번역 모듈 * 코드 개발자 ** 개발자 : 김현종, 최경현 * 적용 대상 ** 고전번역원, 대동지지 ** 고전번역원, 신증동국여지승람 ** 국사편찬위원회, 여지도서 * 자료 공개 ** 비영리적 활동(논문, 연구서)에 본 자료 사용시, 인용 문구만 표시하면 사용에 제한 없음. ** 영리적인 목적(프로젝트)으로 사용할 경우에는 관계자(unqtsi@gmail.com)와 상의 후 처리. ** 본 자료 전체를 다른 곳에서 서비스하는 것은 제한함. ** 본 코드에 오류가 발견된 경우, unqtsi@gmail.com에 오류 신고. ** 인용 표기 : 「기술_지리지_XML」, 202X년 X월 기준, 역지사지(https://www.hisgeo.info). == 코드 아키텍쳐 == # 입력 #* 기관별 공개된 XML 파일 # 파싱 #* XML 계층(Level) 분석 및 메타데이터 추출 #* hanja 라이브러리를 이용한 1차 음차 변환 #* 데이터 정제(태그 제거, 표제어/설명 분리) # 번역 #* Google Gemini API 연동 # 출력 #* 엑셀(XLSX) 데이터베이스 == 공개 DB == === 고전번역원 지리지 XML DB === * '''XML 구조 - 팔도지 기준''' * <아이템> ** <레벨1> *** <레벨2> **** <메타정보> ***** <제목정보> ****** <제목> → [엑셀: '도' 컬럼] ******* <페이지> ***** <간행정보> ****** <간행년> ****** <간행처> **** <레벨3> ***** <메타정보> ****** <제목정보> ******* <제목> → [엑셀: '군현' 컬럼] ***** <레벨4> ****** <메타정보> ******* <제목정보> ******** <제목> → [엑셀: '편목' 컬럼] ********* <원주> ********** <주석> ********* <페이지> ******* <저자정보> ******** <저자> ******* <간행정보> ******* <분류정보> <TODO> === 국사편찬위원회 지리지 XML DB === == 참조 자료 ==
지리지 XML 정규화 개발
문서로 돌아갑니다.
둘러보기 메뉴
개인 도구
한국어
로그인
이름공간
문서
토론
한국어
보기
읽기
원본 보기
역사 보기
더 보기
검색
둘러보기
대문
위키 메뉴
위키 최근문서
위키 모든문서
위키 문법
위키 관리
hisgeo 역지사지란?
hisgeo 계획
도구
여기를 가리키는 문서
가리키는 글의 최근 바뀜
특수 문서 목록
문서 정보