Semantic Web의 정의

from 웹 Plus+α 2006. 8. 13. 22:18

Semantic Web이란, World-wide-web을 창시한 팀 버너스리가 창안한 차세대 웹 기술로, 현재의 웹 처럼 사람이 눈으로 보고 이해하는 웹이 아닌, 컴퓨터가 이해할 수 있는 웹을 의미한다. 팀 버너스리가 정의한 Semantic Web의 정의는 다음과 같다.

"The Semantic Web is an extension of the current web in which information is given well-defined meaning, better enabling computers and people to work in cooperation." -- Tim Berners-Lee, James Hendler, Ora Lassila, The Semantic Web, Scientific American, May 2001

현재 Semantic Web에 대한 기술 연구는 크게 웹의 표준을 담당하고 있는 W3C를 중심으로 한 RDF(Resource Description Framework) 기반의 온톨로지(Ontology) 기술과 ISO를 중심으로 한 Topic Maps 기술로 나눌 수 있다.

RDF와 온톨로지 언어

W3C를 중심으로 하고 있는 Semantic Web 기술은 크게 RDF, RDF-S(RDF Schema)와 DAML+OIL, OWL 등의 온톨로지 언어들을 꼽을 수 있다. 가장 기초가 되는 것은 RDF로, 이는 특정 자원에 대한 메타 데이터를 기술하는 XML 기반의 프레임워크이다. RDF는 레코드(record)를 하나의 기술 단위로 취급해온 기존의 방식과는 달리 자원, 속성, 속성 값을 하나의 단위로 취급하는 이른바 “Triple" 개념이 그 핵심이다. 자원 속성 표현의 세분화로 인해 자원에 대한 좀 더 정교한 기술이 가능해지고, 자원들 간의 관계 설정이 속성(Predicate)를 통해 무한으로 가능하게 되어진다. 각각의 자원들은 URI를 통해 고유 식별자를 가지게 된다. 그리고 자원을 기술하는 속성 명 또한 고유한 URl를 통해 XML Namespace에 정의되어진 속성을 사용함으로써 상호간 의미 충돌을 막는다. 속성의 값으로는 다른 URI가 지정될 수 있으며, 속성 값으로 지정된 자원 역시 다시 기술의 대상이 되기 때문에 그 자원에 대한 속성과 속성 값을 다시 부과할 수 있다.

Fig 1. RDF의 Triple 구조

RDF에서 자원을 기술하는 Triple을 다시 한번 살펴보면, 자원을 나타내는 주어(Subject), 속성을 나타내는 술어(Predicate), 속성의 값을 나타내는 목적어(Object)로 나눌 수 있다. Fig 1.의 예제는 http://www.w3.org/Home/Lassila 라는 웹의 작성자가 Ora Lassila라는 것을 표현하는 RDF의 구조이다. 그리고 [그림 3]은 이러한 구조를 RDF 문법으로 표현한 문서이다.

RDF를 기반으로 하여, 기술 대상이 되는 자원이 어떠한 클래스에 속하며, 그 자원을 기술하는데 필요한 속성에 대한 정의를 가능케 하는 스키마 언어가 등장하게 되었는데 이것이 바로 RDF-Schema이다. 이는 클래스와 클래스 간의 관계, 속성과 속성간의 관계 등을 정의할 수 있으며, 사람이 이해하는 동시에 기계 처리가 가능한 형태로 메타데이터의 속성과 클래스 간의 관계의 표현이 가능하게 되었다. 그리고 이러한 RDF-Schema에서도 충분하지 못했던 모델링 요소들을 좀 더 확장하여 강화한 것이 온톨로지 언어이다. 온톨로지 언어는 RDF-Schema에 좀더 다양한 표현력을 부가해 논리적인 추론이 가능하게 하여 비로소 웹의 의미를 기계가 이해할 수 있는 단계까지 발전시켜 Semantic Web을 완성하게 된다. 대표적인 RDF 기반의 온톨로지 언어로는 DAML+OIL, OWL(Web Ontology Language) 등이 있다.

Topic Maps

RDF와 온톨로지 언어들이 W3C를 중심으로 한 Semantic Web 기술이라면, 본 절에서 설명하는 Topic Maps는 ISO를 중심으로 한 Semantic Web 기술이다. Topic Maps는 ISO/IEC 13250 표준으로 지식 표현 기술(Knowledge Representation)의 표준이다. RDF와 마찬가지로 XML 기반의 표준 기술 언어인 XTM(XML Topic Maps)라는 언어를 사용하여 정보와 지식의 분산 관리를 지원한다. 이는 정보 자원의 구성, 추출, 네비게이션에 관계하는 새로운 패러다임으로, 정보와 지식 관리를 위해 최적화된 표현 양식을 제공하고 있다. Topic Maps는 지식층과 정보층의 이중 구조를 나타내는데, 지식층은 상위 계층으로 토픽(topic)과 토픽간의 연계(Association)로 구성된다. 토픽은 특정 주제를 나타내는 표현이고, 연계는 주제들 간의 관계를 나타내는 표현이다. 정보층은 디지털 컨텐츠를 나타내며, 이들 지식층과 정보층은 어커런스(Occurrence)를 통해 상호 연결이 이루어진다. 다음 Fig 3.은 Topic Maps의 이러한 이중 구조를 표현하고 있다.

Fig 3. Topic Maps의 이중 구조
,