데이터를 기반으로

Semantic Modeling for Data(시멘틱 데이터 모형화) 본문

도서 리뷰/빅데이터&IT

Semantic Modeling for Data(시멘틱 데이터 모형화)

이노후 2022. 4. 22. 00:25
728x90
반응형

도서명 : Semantic Modeling for Data(시멘틱 데이터 모형화)

출판사 : 한빛미디어

 

지은이 : Panos Alexopoulos(파노스 알렉소풀로스) 

 

독서 기간 : 2022-04-10 ~ 2022-04-23

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

 

책 표지

 

처음에 시맨틱 데이터 모형화에 대해 아무것도 모르는 상태에서 이 책을 선정해서 읽는 다는 게 맞는 건가라는 의문을 가지고 있었다. 

 

해당 교재가 아닌 구글에 시맨틱 데이터 모형을 검색해보면 아래와 같은 정의를 확인할 수 있다.

 

"시맨틱 데이터 모델은 특정 논리적 인 방식으로 데이터를 나타 내기 위해 데이터를 구조화하는 방법입니다."

 

이론은 알겠지만 정확히 어떻게 구축되며 어떻게 사용되는 지 하나도 감이 잡히지 않는 정의였다.

 

그렇게 해당 책을 선택하여 읽기 시작했다.

 

 

목차는 크게 3가지로 기초 / 함정 / 딜레마로 나뉘었고 각각의 여러 개의 챕터로 나뉘어 책은 구성되어 있다.

 

1. 기초

 - chapter 1. 시맨틱 격차에 유념하기

 - chapter 2. 시맨틱 모형화 요소

 - chapter 3. 시맨틱 현상과 언어적 현상

 - chapter 4. 시맨틱 모형 품질

 - chapter 5. 시맨틱 모형 개발

 

2. 함정

 - chapter 6. 나쁜 설명

 - chapter 7. 잘못된 의미

 - chapter 8. 잘못된 모형 규격 및 지식 습득

 - chapter 9. 나쁜 품질 관리

 - chapter 10. 잘못된 어플리케이션

 - chapter 11. 나쁜 전략과 나쁜 조직

 

3. 딜레마

 - chapter 12. 표현성 딜레마

 - chapter 13. 표현성과 내용 간의 딜레마

 - chapter 14. 진화와 거버넌스 딜레마

 - chapter 15. 미래 전망

 

 

기초 장에서 시맨틱 모형화에 대한 기초적인 설명들이 구성되어 있다. 시맨틱이란 무엇이며, 시맨틱 모형화를 어떻게 시작하는 지 모형은 어떻게 구성되어 있는 지 등에 대한 설명들이 기재되어 있다.

 

'가장 와 닿은 첫 개념은 데이터 공급자와 이용자간의 시맨틱 격차를 줄이기 위해 시맨틱 모형화를 진행한다.'

 

1차원적으로는 인간과 컴퓨터 시스템 모두가 명료하고 정확하게 이해할 수 있는 방식으로 데이터를 설명하고 데이터 표현을 개발하는 방법이라고 말할 수 있다.

 

컴퓨터 시스템뿐만 아니라 인간과 인간, 위에서 말한 공급자와 이용자간의 이해도 포함된다.

 

이렇게 컴퓨터 시스템과 인간 모두 명확하게 데이터를 설명하는 방식은 온톨로지, 택소노미, E-R모형 등 다양한 방법론이 존재한다. 해당 책에서 온톨로지에 대한 언급이 자주 나와 온톨로지를 직접 유튜브와 구글링을 통해 알아본 결과

 

온톨로지란, 해당 단어를 컴퓨터가 알아들을 수 있게 정의하는 방법이다.

예를 들면, 식사라는 단어를 컴퓨터가 이해할 수 있게 정의를 하는 것은 '밥을 먹는 것' 으로 정의할 수 있다.

'밥을 먹지 않는 것'은 식사라고 부를 수 없다. 이런식으로 이분법 적으로 해당 단어를 정의 하는 방식을 온톨로지라고 한다. (정확한 설명이 아닐 수도 있으니 온톨로지에 대해 찾아보시기를 바랍니다.)

 

위에 정의를 보면 알겠지만 시맨틱 모형화에서 제일 중요한건 모호하거나 애매한 부분을 명확히하고 불확실성을 제거하는 부분에 있다. 

 

이후 방법론적인 부분에서 요소 별로 정의하고 불확실성을 제거하는 방법에 대해 나온다.

 

가장 중요한 포인트는 미래 전망 부분에서 볼 수 있었다. 바로 시맨틱 모형은 모든 것을 포함하고 반영하기에는 현실적인 문제들이 많다는 것이다. 새로운 타입의 이용자가 추가될 때 해당 이용자의 시맨틱 격차를 해소하기 위해 기존에 운영하던 시맨틱 모형을 수정하고 반영하는 지속적인 업데이트 작업이 이루어져야 한다는 것이다.

728x90
반응형