• Title/Summary/Keyword: 의미적 공간 관계 추출

검색결과 47건 처리시간 0.03초

데이터집합 특성에 기반한 데이터 마이닝 전처리 대수 연산자 (Dataset Property - based Algebraic Operators for Data Mining Preprocessing)

  • 김효숙;이원석
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 추계학술발표논문집 (하)
    • /
    • pp.1709-1712
    • /
    • 2002
  • 지식 탐사 연구의 핵심이 되어온 데이터 마이닝은 축적 데이터로부터 쉽게 추출되지 않는 데이터 상호관계나 일정 패턴과 같은 유용한 내재 정보 추출을 주된 목적으로 수행된다. 그러나, 데이터 마이닝은 대용량의 데이터 처리로 인해 빈번한 메모리 공간 제약과 처리 속도 저하 등의 한계성을 드러낸다. 이를 극복하기 위해 많은 마이닝 알고리즘 개발과 기존 알고리즘 개선 방법이 제시되어 왔으나 여전히 궁극적인 해결방안은 대두되지 않고 있다. 따라서, 만약 데이터 전처리 과정을 통해 마이닝 목적에 적합한 부분 데이터집합 추출 및 가공이 선행된다면 보다 효율적인 데이터 마이닝 작업을 유도할 수 있을 것이다. 본 논문은 효과적 데이터 전처리를 위한 필수 기본 연산 기능들을 주어진 데이터집합의 트랜잭션 및 데이터 특성에 기초하여 관계형 대수 형태로 의미를 정립하고, 적용 사례에 의한 상세 설명 및 실제 구현된 온라인 데이터 전처리 시스템을 제안한다.

  • PDF

동양 관상학을 적용한 성격별 얼굴 설계 시스템에 관한 연구 (A Study on Facial Visualization System based on one's Personality applied with the Oriental Physiognomy)

  • 강선희;김효동;이경원
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2008년도 학술대회 2부
    • /
    • pp.346-357
    • /
    • 2008
  • 관상학(Physiognomy)이란 사람의 얼굴을 보고 그의 운명, 성격, 수명 따위를 판단하는 방법을 연구하는 학문을 말한다. 이 논문에서 언급하는 관상학은 동양에서 말하는 관상학, 특히 얼굴의 부분적 특성이나 전체적인 조화를 통해 성격과 운영을 예측하는 학문을 의미한다. 이 연구는 동양 관상학을 적용한 성격별 얼굴 설계 시스템 구축에 관한 것으로, 첫째, 보편적인 성격 분류를 위해 MBTI에서 다루는 성격 어휘 161개를 군집분석을 통해 39개의 대표 어휘로 추출하였다. 추출된 대표 성격 어휘의 의미상 거리를 나타내기 위하여 서베이를 통해 얻은 데이터를 다차원 척도법을 통해 2차원 공간상에 성격 어휘의 관계를 분석하였다. 둘째, 얼굴 시각화를 위해 먼저 얼굴의 형태적 특성을 결정짓는 요소를 크게 얼굴형, 눈, 코, 입, 이마, 눈썹으로 분류하고, 분류된 6가지 얼굴 형태의 29가지 하위요소 별 성격을 한국인의 얼굴 특성을 기준으로 관상학적 정리 및 숫자형식 코드화를 하였다. 추출된 대표 성격 어휘별 얼굴 요소의 형태를 앞서 정리된 코드에 따라 하나의 얼굴 형태로 조합하여 39가지 얼굴을 시각화 하여 마지막으로, 성격별 얼굴 설계 시스템 'FACE'를 제작하였다. 이 연구는 사람의 성격 특성에 따라 그에 맞는 얼굴 형태를 구현하는 시스템을 제작하여 일반 사용자 뿐 아니라 애니메이션 캐릭터 개발자에게 객관적인 도움을 줄 수 있으며 또한 예로부터 내려오는 관상학의 적용 범위를 넓힐 수 있는 가능성을 보여주었다고 할 수 있다.

  • PDF

BERT와 지식 그래프를 이용한 한국어 문맥 정보 추출 시스템 (Korean Contextual Information Extraction System using BERT and Knowledge Graph)

  • 유소엽;정옥란
    • 인터넷정보학회논문지
    • /
    • 제21권3호
    • /
    • pp.123-131
    • /
    • 2020
  • 인공지능 기술의 비약적 발전과 함께 사람의 언어를 다루는 자연어 처리 분야 역시 활발하게 연구가 진행되고 있다. 특히 최근에는 구글에서 공개한 언어 모델인 BERT는 대량의 코퍼스를 활용해 미리 학습시킨 모델을 제공함으로써 자연어 처리의 여러 분야에서 좋은 성능을 보이고 있다. BERT에서 다국어 모델을 지원하고 있지만 한국어에 바로 적용했을 때는 한계점이 존재하기 때문에 대량의 한국어 코퍼스를 이용해 학습시킨 모델을 사용해야 한다. 또한 텍스트는 어휘, 문법적인 의미만 담고 있는 것이 아니라 전후 관계, 상황과 같은 문맥적인 의미도 담고 있다. 기존의 자연어 처리 분야에서는 어휘나 문법적인 의미를 중심으로 연구가 주로 이루어졌다. 텍스트에 내재되어 있는 문맥 정보의 정확한 파악은 맥락을 이해하는 데에 있어 중요한 역할을 한다. 단어들의 관계를 이용해 연결한 지식그래프는 컴퓨터에게 쉽게 문맥을 학습시킬 수 있는 장점이 있다. 본 논문에서는 한국어 코퍼스를 이용해 사전 학습된 BERT 모델과 지식 그래프를 이용해 한국어 문맥 정보를 추출하는 시스템을 제안하고자 한다. 텍스트에서 중요한 요소가 되는 인물, 관계, 감정, 공간, 시간 정보를 추출할 수 있는 모델을 구축하고 제안한 시스템을 실험을 통해 검증한다.

우리말 감성 어휘의 범주-차원 모형 - 직물 디자인의 시각적 요소와 관련하여 - (Category-based dimensional model of affective words)

  • 박수진;정찬섭
    • 감성과학
    • /
    • 제2권1호
    • /
    • pp.77-94
    • /
    • 1999
  • 직물 및 직물 관련 제품에서 주로 사용되는 감성 어휘들의 관계 및 구조를 분석하기 위해 잡지 및 설문 조사 과정을 통해 어휘를 수집하였다. 수집된 어휘의 빈도를 조사하고, 어휘 적절성을 평가하여 감성어라고 생각될 수 있는 어휘들만을 정리하였다. 여기서 추출된 372개의 어휘는 직물 및 직물 관련 상황에서의 감성어로 사용될 수 있을 분만 아니라 유사 분야의 감성어 모형에 대한 기본 자료로 활용될 수 있을 것이다. 어휘들 간 관계구조에 대한 분석은 몇 가지 면에서 이뤄졌다. 자유연상 과제를 실시하여 어휘들 간 관계의 연결망(network)을 확인할 수 있었다. 어휘들이 내포하고 있는 의미의 여러 측면에서 어휘들 간 관계를 파악할 수 있도록 어휘들에 대해 다차원 분석을 실시한 결과 어휘 간 관계는 3차원이면 충분히 설명될 수 있는 것으로 나타났다. 두 개의 주차원을 중심으로 어휘들의 공간 분포를 그리고 이들 어휘를 범주로 분류한 결과 대략 11개의 범주로 어휘들을 나눠볼 수 있었다.

  • PDF

웹 기반 소셜 네트워크에서 시맨틱 관계 추론 및 시각화 (Inferring and Visualizing Semantic Relationships in Web-based Social Network)

  • 이승훈;김지혁;김흥남;조근식
    • 지능정보연구
    • /
    • 제15권1호
    • /
    • pp.87-102
    • /
    • 2009
  • 최근 Web 2.0 발달과 더불어 블로그나 온라인 카페 등 웹 상의 네트워크화 된 정보 공간에 사용자가 자신의 개인적인 정보를 자유롭게 게재할 수 있도록 하는 서비스가 증가하면서, 이 사용자들 간의 관계에 초점을 맞춘 소셜 네트워크 분야의 연구가 활발히 이루어지고 있다. 이와 같은 사용자들은 단순히 사회적인 측면뿐만 아니라 교육, 정치, 경제 등의 다양한 분야의 가상의 커뮤니티를 형성함으로서 현대 사회의 주요한 한 부분으로 자리매김하고 있다. 하지만 많은 소셜 네트워크 서비스가 정보자원을 컴퓨터가 처리할 수 있는 의미적인 정보로 표현하고 있지 않기 때문에 서로 다른 도메인 간에 공유와 재사용이 제대로 이루어지지 않고 있다. 또한 사회적 개체들 간의 관계가 명확하게 정의되어 있지 않아 알려져 있지 않은 의미적 관계를 발견해내는 소셜 네트워크 분석에 어려움이 있다. 본 논문에서는 가상 커뮤니티의 사용자들이 업로드 한 사진 데이터를 이용하여 사진 속의 개체나 소유자들 간의 사회적 관계를 분석하기 위해 시맨틱 웹 기반의 소셜 네트워크 분석 시스템을 제안한다. 온톨로지를 기반으로 사진에서 추출된 얼굴 개체간의 관계와 이미 인맥 관계를 형성하고 있는 사람들의 정보적 연결성을 명확하게 정의하고 도메인 규칙을 활용하여 의미 있는 사회적 연결 관계를 추론한다. 최종적으로 이를 그래프로 시각화하여 사용자에게 제공함으로써 온라인 상에서 형성된 커뮤니티 내에서 효율적인 소셜 네트워크 분석(Social Network Analysis)을 도모하고 이를 기반으로 다양한 응용 분야에 활용하는 방법을 모색한다.

  • PDF

영한 기계 번역에서 미가공 텍스트 데이터를 이용한 대역어 선택 중의성 해소 (Target Word Selection Disambiguation using Untagged Text Data in English-Korean Machine Translation)

  • 김유섭;장정호
    • 정보처리학회논문지B
    • /
    • 제11B권6호
    • /
    • pp.749-758
    • /
    • 2004
  • 본 논문에서는 미가공 말뭉치 데이터를 활용하여 영한 기계번역 시스템의 대역어 선택 시 발생하는 중의성을 해소하는 방법을 제안한다. 이를 위하여 은닉 의미 분석(Latent Semantic Analysis : LSA)과 확률적 은닉 의미 분석(Probabilistic LSA : PLSA)을 적용한다. 이 두 기법은 텍스트 문단과 같은 문맥 정보가 주어졌을 때, 이 문맥이 내포하고 있는 복잡한 의미 구조를 표현할 수 있다 본 논문에서는 이들을 사용하여 언어적인 의미 지식(Semantic Knowledge)을 구축하였으며 이 지식은 결국 영한 기계번역에서의 대역어 선택 시 발생하는 중의성을 해소하기 위하여 단어간 의미 유사도를 추정하는데 사용된다. 또한 대역어 선택을 위해서는 미리 사전에 저장된 문법 관계를 활용하여야 한다. 본 논문에서는 이러한 대역어 선택 시 발생하는 데이터 희소성 문제를 해소하기 위하여 k-최근점 학습 알고리즘을 사용한다. 그리고 위의 두 모델을 활용하여 k-최근점 학습에서 필요한 예제 간 거리를 추정하였다. 실험에서는, 두 기법에서의 은닉 의미 공간을 구성하기 위하여 TREC 데이터(AP news)론 활용하였고, 대역어 선택의 정확도를 평가하기 위하여 Wall Street Journal 말뭉치를 사용하였다. 그리고 은닉 의미 분석을 통하여 대역어 선택의 정확성이 디폴트 의미 선택과 비교하여 약 10% 향상되었으며 PLSA가 LSA보다 근소하게 더 좋은 성능을 보였다. 또한 은닉 공간에서의 축소된 벡터의 차원수와 k-최근점 학습에서의 k값이 대역어 선택의 정확도에 미치는 영향을 대역어 선택 정확도와의 상관관계를 계산함으로써 검증하였다.젝트의 성격에 맞도록 필요한 조정만을 통하여 품질보증 프로세스를 확립할 수 있다. 개발 된 패키지의 효율적인 활용이 내조직의 소프트웨어 품질보증 구축에 투입되는 공수 및 어려움을 줄일 것으로 기대된다.도가 증가할 때 구기자 열수 추출 농축액은 $1.6182{\sim}2.0543$, 혼합구기자 열수 추출 농축액은 $1.7057{\sim}2.1462{\times}10^7\;J/kg{\cdot}mol$로 증가하였다. 이와 같이 구기자 열수 추출 농축액과 혼합구기자 열수 추출 농축액의 리올리지적 특성에 큰 차이를 나타내지는 않았다. security simultaneously.% 첨가시 pH 5.0, 7.0 및 8.0에서 각각 대조구의 57, 413 및 315% 증진되었다. 거품의 열안정성은 15분 whipping시, pH 4.0(대조구, 30.2%) 및 5.0(대조구, 23.7%)에서 각각 $0{\sim}38.0$$0{\sim}57.0%$이었고 pH 7.0(대조구, 39.6%) 및 8.0(대조구, 43.6%)에서 각각 $0{\sim}59.4$$36.6{\sim}58.4%$이었으며 sodium alginate 첨가시가 가장 양호하였다. 전체적으로 보아 거품안정성이 높은 것은 열안정성도 높은 경향이며, 표면장력이 낮으면 거품형성능이 높아지고, 비점도가 높으면 거품안정성 및 열안정성이 높아지는 경향이 있었다.protocol.eractions between application agents that are developed using different

장 누벨 작품 공간에 나타나는 맥락적 특성에 관한 연구 (A Study on the Contextual special quality in Jean Nouvel's projects)

  • 이찬;윤현숙
    • 디자인학연구
    • /
    • 제20권1호
    • /
    • pp.111-120
    • /
    • 2007
  • 본 연구는 우리의 현대 건축이 극복해야할 과제인 지역적, 역사적 문제점의 해결방안으로써 맥락적 공간 표현을 하나의 가능성으로 제시하고 있다. 모더니즘 건축이 역사적, 장소적 맥락의 특수성을 거부하고 익명적인 공공성만을 지향하였다면, 이후의 포스트모던 건축, 지역주의건축 등은 다양한 역사적, 환경적 요소를 적극적으로 이용하여 단절되었던 맥락의 의미를 되살리고자 노력하였다. 그러나 이러한 시도들은 맥락을 피상적으로만 이해하여 건축의 소재로만 차용하였을 뿐, 끊임없이 변화하는 맥락을 수용해내지 못했다. 이러한 현대의 변화하는 맥락성에 대응 할 수 있는 공간 계획을 설명할 수 있는 건축가로 장 누벨을 선정하여 그의 건축공간에서 맥락적 표현 특성을 파악하고 작품을 사례로 분석하고자 하였다. 우선 맥락주의의 이론적 고찰을 바탕으로 건축적 맥락의 특징을 장 누벨의 맥락적 공간 표현과 비교하여 그 관계성을 찾았고, 위상기하학적 조작, 표피의 물질성, 투명성을 통하여 장 누벨이 단지 건축과 공간 내부에만 머물지 않고 자신을 둘러싼 세계를 이해하고 독창적인 해석과 표현방식을 통해 맥락성을 표현하고자 하였다. 그래서 본 연구를 통해 맥락성이란 임의적으로 추출되어 공간화 및 고정화된 것이 아니라, 과거에서부터 지금까지 그리고 앞으로도 지속적으로 흐르고 변화하는 유동적인 개념으로 받아들여야 할 것임을 시사해주고 있다.

  • PDF

텍스트 마이닝을 위한 그래프 기반 텍스트 표현 모델의 연구 동향 (A Study on Research Trends of Graph-Based Text Representations for Text Mining)

  • 장재영
    • 한국인터넷방송통신학회논문지
    • /
    • 제13권5호
    • /
    • pp.37-47
    • /
    • 2013
  • 텍스트 마이닝은 비정형화된 텍스트를 분석하여 그 안에 내재된 패턴, 추세, 분포 등의 고급정보들을 추출하는 분야이다. 텍스트 마이닝은 기본적으로 비정형 데이터를 가정하므로 텍스트를 단순화된 모델로 표현하는 것이 필요하다. 현재까지 가장 많이 사용되고 있는 모델은 텍스트를 단순한 단어들의 집합으로 표현한 벡터공간 모델이다. 그러나 최근 들어 단어들의 의미적 관계까지 표현하기 위해 그래프를 이용한 텍스트 표현 모델을 많이 사용하고 있다. 본 논문에서는 텍스트 마이닝을 위한 기존의 연구 중에서 그래프에 기반한 텍스트 표현 모델의 방법들과 그들의 특징들을 기술한다. 또한 그래프 기반 텍스트 마이닝의 향후 발전방향에 대해서도 논한다.

다중요인모델에 기반한 텍스트 문서에서의 토픽 추출 및 의미 커널 구축 (Multiple Cause Model-based Topic Extraction and Semantic Kernel Construction from Text Documents)

  • 장정호;장병탁
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권5호
    • /
    • pp.595-604
    • /
    • 2004
  • 문서 집합 내의 개념 또는 의미 관계의 자동 분석은 보다 효율적인 정보 획득과 단어 이상의 개념 수준에서의 문서간 비교를 가능케 한다. 본 논문에서는 다중요인모델에 기반 하여 텍스트 문서로부터 토픽들을 추출하고 이로부터 의미 커널(semantic kernel)을 구축하여 문서간 유사도를 측정하는 방안을 제시한다. 텍스트 문서는 내재된 토픽들의 다양한 결합에 의해 생성된다고 가정하며 하나의 토픽은 공통 주제에 관련되거나 적어도 자주 같이 나타나는 단어들의 집합으로 정의한다. 다중요인모델은 은닉층을 갖는 하나의 네트워크 형태로 표현되며, 토픽을 표현하는 단어 집합은 은닉노드로부터의 가중치가 높은 단어들로 구성된다. 일반적으로 이러한 다중요인 네트워크에서의 학습과 추론과정을 용이하게 하기 위해서는 근사적 확률 추정 기법이 요구되는데, 본 논문에서는 헬름홀츠 머신에 의한 방법을 활용한다. TDT-2 문서 집합에 대한 실험에서 토픽별로 관련 있는 단어 집합들을 추출할 수 있었으며, 4개의 텍스트 집합에 대한문서 검색 실험에서는 다중요인모델의 분석결과에 기반 한 의미 커널을 사용함으로써 기본 벡터공간 모델에 비해 평균정확도 면에서 통계적으로 유의한 수준의 성능 향상을 얻을 수 있었다.

Tank 모형의 기저유출 매개변수 산정에 관한 연구 (A Study on Baseflow Parameters Estimation of Tank Model)

  • 구보영;정일원;배덕효
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2006년도 학술발표회 논문집
    • /
    • pp.1970-1974
    • /
    • 2006
  • Tank 모형은 유역을 임의의 저류탱크로 가정하여, 유출공의 높이를 초과하는 저류고를 방출함으로써 유출량을 모의한다. 유출분석의 목적에 따라 직렬 3단 혹은 4단의 탱크로 구성하여 적용하는 것이 일반적인데, 국내의 일 단위 장기유출분석 연구에서는 직렬 4단 Tank 모형이 널리 활용되고 있다. 이러한 Tank 모형은 유역의 강우-유출관계를 모의하는 과정에 black box적인 특성을 지니고 있다. 그러나 각 저류탱크와 관련된 매개변수를 최적화하기 위해서는 매개변수들의 물리적인 의미를 이해하여야 한다. 이런 점을 고려하여 일본의 Sugawara는 경험적으로 매개변수들이 결정되는 범위를 제시한 바 있다. 그러나 기저유출을 모의하는 Tank 모형의 최하단 탱크에서 이러한 매개변수 범위에서는 적합한 값을 갖으나 장기적인 모의시에 저류고 및 유출고가 계속 증가하여 물리적인 유출특성을 반영하지 못하는 문제점이 나타났다. 따라서 본 연구에서는 이러한 문제점의 원인을 분석하기 위해 장기간의 자료가 구축된 소양강댐을 적용 유역으로 선정하여 최하단탱크의 유출공계수의 변화에 따른 유출량과 저류고의 변화를 살펴보았다. 분석결과 매개변수가 $0.0001{\sim}0.001$의 범위에서 장기간의 지속적인 저류고와 유출량의 증가가 나타났다. 그리고 유출공계수가 증가함에 따라 최대저류고는 감소하고, 저류고가 증가하는 지속기간이 짧아지는 것으로 나타났다. 그러나 통계치 변화분석에서는 상관계수, 평균제곱근오차, 모형효율성계수에서 거의 변화가 없는 것으로 나타났으며, 유출용적오차에서도 최대 약 6% 정도 유출용적이 변화하는 것으로 나타났다.mber)과 동일한 위치의 수온자료를 기초로 회귀분석을 실시함으로써 수온추출 알고리즘을 도출하여, 분석데이터의 신뢰도를 검증하였으며, 수온, 클로로필, 투명도 등을 위성원격탐사 자료와 GIS를 이용하여 공간분석을 실시하고, 공간분포도를 작성함으로써 대상해역의 해양환경을 파악하였다. 본 연구결과, 분석된 위성자료가 현장조사에 의한 검증이 이루어지지 않을 경우, 영상자료분석을 통한 표층수온 추출은 대기 중의 수증기와 에어로졸에 의한 계산치의 오차가 반영되기 때문에 실측치 보다 낮게 평가 될 수 있으므로, 반드시 이에 대한 검증이 필요함을 알 수 있었다. 현지관측에 비해 막대한 비용과 시간을 절약할 수 있는 위성영상해석방법을 이용한 방법은 해양수질파악이 가능할 것으로 판단되며, GIS를 이용하여 다양하고 복잡한 자료를 데이터베이스화함으로써 가시화하고, 이를 기초로 공간분석을 실시함으로써 환경요소별 공간분포에 대한 파악을 통해 수치모형실험을 이용한 각종 환경영향의 평가 및 예측을 위한 기초자료로 이용이 가능할 것으로 사료된다.염총량관리 기본계획 시 구축된 모형 매개변수를 바탕으로 분석을 수행하였다. 일차오차분석을 이용하여 수리매개변수와 수질매개변수의 수질항목별 상대적 기여도를 파악해 본 결과, 수리매개변수는 DO, BOD, 유기질소, 유기인 모든 항목에 일정 정도의 상대적 기여도를 가지고 있는 것을 알 수 있었다. 이로부터 수질 모형의 적용 시 수리 매개변수 또한 수질 매개변수의 추정 시와 같이 보다 세심한 주의를 기울여 추정할 필요가 있을 것으로 판단된다.변화와 기흉 발생과의 인과관계를 확인하고 좀 더 구체화하기 위한 연구가 필요할 것이다.게 이

  • PDF