CKAN

  • OpenDataPlatform/CKAN 분석

    03. CKAN 프레임워크 - Pandas

    안녕하세요. Ckan 프레임워크에서 데이터를 추가할 때 프로파일링 기능을 추가하고자 합니다. Python기반의 모듈인 Pandas를 활용하여 Profiling 기능을 개발했습니다. 제일 중요한게 개발 환경인데요. CKAN 및 Python 그 외 모듈의 버전은 다음과 같이 진행하였습니다. Ubuntu OS python 2.7 pandas 0.20.2 numpy 1.12.0 xlsxwriter 1.1.8 페이지 추가 데이터 셋 메뉴에 데이터셋 추가 버튼을 통해서 추가할 수 있습니다. Pandas를 이용한 Profiling 기능을 가진 페이지를 추가할 건데요. 페이지를 추가하기 위해 알아야할 부분을 확인해보겠습니다. 은 데이터셋 초기 화면입니다. 메뉴에서 데이터셋 버튼을 눌렀을 때 나오는 페이지이죠. Temp..

  • OpenDataPlatform/CKAN 분석

    02. CKAN 프레임워크 - Solr

    안녕하세요. CKAN의 중요 한 축을 담당하고 있는 검색엔진 Solr에 대해 알아보겠습니다. Apache Lucene(루씬)은 자바 언어로 이루어진 정보 검색 라이브러리입니다. Solr와 Elasticsearch 검색엔진은 루씬을 기반의 API입니다. 실제로 CKAN 내부에서 Solr 라이브러리를 보면 루씬 라이브러리가 포함되어있는 것을 볼 수 있습니다. Solr나 Lucene은 페이스북이나 트위터 등 다들 알고 있는 기업의 제품에 인베디드돼 이용되고 있습니다. CKAN에서는 이러한 Solr를 어떻게 적용했고 어떤 구조로 되어있는지 정리했습니다. 우선 Solr 디렉토리먼저 살펴보겠습니다. '/etc/solr' : solr 설정 파일이 들어있는 디렉토리입니다. '/usr/share/solr' : solr ..

  • OpenDataPlatform/DCAT

    DCAT (데이터 카탈로그 메타데이터 표준) - (1)RDF

    DCAT (Data Catalogue Vocabulary) 웹에 존재하는 데이터 목록 간의 상호운용성을 높이기 위해 설계된 RDF 어휘 DCAT 이해를 위해 RDF - XML - DCAT 순으로 진행하겠습니다. RDF란 RDF는 Resource Description Framework 자원을 설명하는 프레임워크를 의미합니다. Resource : URI로 표현할 수 있는 모든 것 Description : 자원이 가질 수 있는 속성, 특징을 설명 웹에 있는 자원에 관한 메타 정보를 표현하기 위한 언어로서 W3C(국제 웹 표준기구의 )의 가장 기본적 시멘틱 웹 언어로서 웹 자원을 표현하는데 기본이 되는 제목, 저자, 최종 수정일, 저작권과 같은 웹 문서에 관한 메타데이터를 XML 기반으로 간단하게 표현합니다. ..