시멘틱 웹과 온톨로지

from 웹 Plus+α 2006. 8. 14. 12:26

시맨틱 웹의 온톨로지를 이용한 eBIZ 활용방안

이경희(수원여자대학 교수)

이제 인터넷이 없으면 생활의 불편함마저 느끼는 단계에 접어들었다. 이에 따라 웹에서 제공되는 수많은 데이터들, 서로 다른 형태의 데이터들끼리 어떻게 하면 상호 운영을 하는지에 대해 많은 연구가 진행되어 왔다. 인터넷에 지능을 추가해 스스로 정보를 판단할 수 있는 차세대 인터넷인 시맨틱 웹의 필수요소로서 온톨로지는 웹의 수많은 데이터를 상호 운영할 수 있게 만든 데이터의 사전이라 할 수 있다. 현재 활발하게 연구되는 온톨로지를 이용한 eBIZ 분야의 활용방안과 향후 비전을 예측해 본다.

현재의 웹은 사용자가 목적에 맞게 정보를 클릭하면서 정보를 찾아내는 게 일반적인 방식이다. 하지만 차세대 웹인 시맨틱 웹은 임무를 부여받은 자동화된 프로그램이 사람을 대신해 웹상의 정보를 추출하고 이를 가공해 새로운 정보를 만들어낼 수 있는 인터넷을 말한다. 이렇게 사람대신 자동적으로 처리해주는 프로그램을 ‘에이전트’(Agent) 또는 ‘대행자’라고도 한다. 만일 내가 여행계획이 있어서 웹으로 여행정보를 찾는다면 비행기와 호텔 등을 일일이 다 찾아다니면서 비교 분석해 예약해야 한다. 그러나 시맨틱 웹에서는 트래블 에이전트에게 대략적으로 휴가일정과 개인적인 선호도만 알려주면 여행에 필요한 모든 예약을 알아서 해주는 것과 같은 원리다. 날씨가 좋지 않거나 비가 오면 트래블 에이전트는 과거에 내가 했던 패턴을 분석 추론해 여행 계획을 취소하는 등의 일이 가능한 것이 시맨틱 웹이 할 수 있는 일이다.

정보간의 관계 분석

현재의 웹은 전세계 대학과 연구소에 흩어진 물리학자들간의 공동연구에 필요한 정보 교환 방안으로 1989년 팀버너스리에 의해 창안됐다. 그 이후 웹은 가히 혁명적일만큼 인터넷 발전에 영향을 미쳤으며, W3C를 주축으로 웹의 발전에 필요한 기술과 표준을 제정하고 있다. 웹 발전과 창안을 주도한 팀버너스리가 차세대 웹으로 제시한 시맨틱 웹은 웹 상에 존재하는 정보들을 사람뿐만 아니라 컴퓨터 프로그램 같은 기계들이 해독하고 작업하기 용이하게 표현해 이들 정보간의 관계(Relation)를 추출하면서 다양한 응용 영역까지 자동화되고 통합된 정보 공유를 이루는 것이 목표다.

이처럼 시맨틱 웹은 컴퓨터 스스로가 웹에 연결된 정보의 의미를 인식하고, 사용자가 필요로 하는 정보를 검색하며 검색된 정보에서 지식을 추론할 수 있는 기능을 제공한다. 팀버너스리는 이러한 기능 및 수단을 제공할 수 있도록 XML을 기반으로 하는 계층 구조를 제시했다. <그림 1>은 시맨틱 웹의 계층 구조다.

△URI: 정보 자원을 식별하는 문자열로서 웹으로 제공되는 정보 자원들을 하이퍼링크로 연결하기 위해 사용되는 네트워크 경로와 정보 자원에 부여된 고유 이름이다.

△XML: XML은 W3C에서 제정한 메타언어다. HTML이 사용자 위주의 스타일 언어라 한다면 XML은 문서의 활용성을 확대해 사용자가 필요로 하는 태그들을 정의하고 사용할 수 있게 만들었다.

△RDF: XML에서 부족한 정형화된 의미를 생성할 수 있게 설계됐다. RDF는 웹 상에 존재하는 자원들간의 관계를 기술하는 프레임워크로 메타데이터를 사용해 자원들간의 상호 운영성을 지원하고 컴퓨터가 인식할 수 있는 메타데이터를 정의하는 역할을 한다.

△온톨로지: RDF나 RDFS는 웹 자원을 표현하기 위해 어휘, 구조 및 제약조건에 대한 방법만을 제공하기 때문에 표현되는 지식을 처리할 수 없다. 따라서 지식을 표현하고 추론할 수 있는 통합된 데이터 사전이 필요한 것이다. 이 온톨로지는 온톨로지 레퍼지토리에 저장돼 재사용, 공유, 학습, 추론이 가능하게 되는 것이다.

이 중 시맨틱웹에서 온톨로지를 구축하는 것이 가장 중요한 일이다. 이 온톨로지를 이용한 다양한 활용분야가 있기 때문에 여기서는 온톨로지에 대해 다룬다. 온톨로지는 재사용과 공유를 위한 통합된 데이터 사전이기 때문에 다양한 분야에서 온톨로지를 생성해 활용할 수가 있다. 다음은 온톨로지가 어떻게 생성되는지와 어떤 분야에 활용되는지에 대한 설명이다.

온톨로지의 역할

많은 연구자들은 온톨로지에 대해 다양한 정의를 내렸지만, 가장 쉽게 온톨로지를 풀이해보면 ‘공유할 수 있는 개념화된 명세’로 정의할 수 있다. 온톨로지는 웹이 급속하게 발전하면서 대용량의 정보를 공유해 여러 가지 분야에 활용하고자 만들어진 개념이다. 즉 다양한 이기종 환경에서 도메인의 지식을 공유하고 재사용하기 위해 온톨로지라는 개념이 생겨났다.

온톨로지는 개념과 관계로 모든 지식을 표현할 수 있는 것이다. <표>은 온톨로지를 생성하기 위한 구성요소를 도식화한 것이다. 첫번째 단계는 일반적인 정보로부터 온톨로지를 생성하기 위한 구체적인 모델링을 하는 것이고, 두번째 단계는 온톨로지 언어를 이용해 실제로 온톨로지를 생성하는 것이다. 그 다음 단계는 생성된 온톨로지가 적당한 것인지, 전문가 또는 툴에 의해 판단해 좀 더 좋은 온톨로지를 생성할 수 있게 검사하는 것이다.

최근 IT나 eBIZ 환경에서 가장 큰 화두는 통합이다. 이 화두에 가장 적절하게 동작할 수 있는 것이 바로 온톨로지인 것이다. 이 온톨로지는 도메인을 한정해 많이 생성돼 있고, 소규모 온톨로지를 생성하고 결합해 활용하기도 한다.

온톨로지를 사용하는 가장 큰 목적이 정보의 공유와 재사용인 만큼 이를 필요한 곳이면 모든 온톨로지를 이용할 수 있는 것이다. 이에 인터넷을 중심으로 온톨로지를 활용하는 방안에 대해 설명한다. 네트워크를 서로 다른 타입에 따라 분류를 해보면 다음과 같다.

즉 △Intranet은 폐쇄된 사용자 커뮤니티 및 회사나 조직에서 사용하고 △Internet은 개방된 커뮤니티와 전세계적인 범용 커뮤니티이며 △Extranet은 인터넷에서부터 인트라넷까지 제한된 aceess를 제공하는 것이다. <그림 2>는 네트워크 분류에 따른 활용분야를 도식화한 것이다.

▲Knowledge Management
KMS는 지식경영을 하기 위해 필요한 애플리케이션이다. 각 기업들은 타 경쟁사와의 치열한 경쟁에서 살아남기 위해 각 회사의 노하우, 또는 지식들을 관리하기 위해 많은 투자를 하고 있다. 이에 따라 분산된 인터넷 환경에서 온톨로지를 이용한 KMS 구축 사례는 외국의 경우 많은 성공을 보고 있다. 온톨로지를 이용해 KMS를 구축, 관리할 수 있는 툴도 많이 개발돼 있는 상태다.

▲Web Commerce
eCommerce는 중요한 비즈니스 분야로 자리매김하고 있고 시장도 아주 크게 성장하고 있다. 온톨로지를 이용해 Web Commerce를 구축한다면 비용의 절감과 분산된 정보를 쉽게 통합해 Commerce에 필요한 것을 손쉽게 생성할 수 있다. 지능이 가미된 구매 에이전트 등 좀더 지능화된 Commerce를 표현할 수 있다. Web Commerce는 크게 세 분야로 구성될수 있다. 쇼핑을 도와주는 쇼핑 에이전트, 지능화된 온라인 가게, 지능화된 information broker(온라인 마켓 플레이스) 등으로 구성된다. 이 분야는 온톨로지를 이용해 가장 활성화 될 것으로 예측된다.

▲기타 애플리케이션 활용
CRM(Customer Relationship Management), ERP (Enterprise Resource Planning), 정보통합(information integration) 등 다양한 애플리케이션을 온톨로지를 이용해 구축할 수가 있다. 예를 들면 카드회사의 CRM을 온톨로지를 이용해 구축한다면, 카드정보에 대한 모든 지식이 온톨로지화해 지능화된 CRM이 구축될 것이다. 이 온톨로지는 기반 지식을 바탕으로 추론까지 가능하므로, 예측되고 관리될 수 있는 CRM 구축도 가능한 것이다.

온톨로지를 이용한 ebiz 전망

웹서비스를 구축할 때도 웹서비스의 구성요소인 SOAP(Simple Object Acess Protocol), UDDI(Universal Description Discovery&Integration), WSDL(Webservice Description Language) 등이 있다. 그 중에서 UDDI는 온톨로지를 이용해 레포지토리로 구현할 수 있어 어디서나 온톨로지는 활용될 수 있다. 특히 요즘 ITA를 이용한 전자정부 구축에도 온톨로지를 이용해 구축 활용하면 많은 재활용과 표준 통합에도 적절하게 사용할 수 있는 장점이 있다. 소프트웨어 공학분야에서도 현재 MDA(Model-Driven Architecture)구축시 온톨로지를 이용해 개념 정립을 해 활용이 가능하다. 이 온톨로지를 활용하는 분야는 앞으로 더욱 다양하고 폭넓게 확장될 것이다. 현재 우리나라에서는 도메인 특정분야로 유전자 온톨로지가 구축돼 의료분야에 활발하게 이용되고 있다. 그러나 온톨로지를 이용해 각 애플리케이션에서 활용할때 장점만 존재하는 게 아니다.

도메인 특정분야의 소규모 온톨로지끼리 서로 결합시킬 때 많은 문제점이 속출될 것으로 예상된다. 이 분야에 대해서는 계속 연구 중에 있지만 이점을 그냥 간과해서는 안될 것이다. 도메인 특정분야의 온톨로지는 계속 시장형성이 늘어날 전망이다. 해외에서는 온톨로지를 이용한 추론 연구가 활발히 진행되고 있으며, 모바일 환경에서도 시맨틱 웹을 적용하는 연구가 진행될 것으로 보인다. 앞으로 ebiz분야에서 온톨로지를 활용하는 분야는 계속 증가할 것으로 전망된다.

>>참고 자료
시맨틱웹의 개요와 현황: 한국정보과학회지
ontologies: Michael L. Brodie
A FrameWork For Automatic Ontology Generation -Giovanni Modica
시맨틱 웹의 표준 기술 동향: 이재호, 양정진
OntoKnowledge:
www.ontoknoeledge.com
W3C: www.w3c.org

출처 : 경영과 컴퓨터[2004년 3월호]
출처 :
http://blog.naver.com/dl_ontology.do

,