• 제목/요약/키워드: 의미 거리

검색결과 676건 처리시간 0.024초

구매이력 데이터에서 상품 분류 체계를 고려한 시퀀스 유사도 측정 기법 (A Sequence Similarity Measure Considering the Product Taxonomy in Transaction Data)

  • 양유정;이기용
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 춘계학술발표대회
    • /
    • pp.367-370
    • /
    • 2019
  • 본 논문은 구매이력 데이터에서 상품간의 분류 체계를 고려하여 시퀀스 간의 유사도를 계산하는 새로운 방법을 제안한다. 시퀀스란 두 항목간의 순서가 존재하는 데이터를 의미한다. 항목 간의 선후관계가 중요한 시퀀스 데이터에서는 두 시퀀스 간의 유사도를 정확히 정의하는 것이 중요하다. 본 논문에서는 대표적인 시퀀스 유사도 측정 알고리즘인 편집 거리 알고리즘을 활용하여 구매이력 데이터에서 시퀀스 간의 유사도를 정의한다. 상품은 상품의 특성에 따라 항목 분류 체계에서 여러 범주로 분류된다. 이 경우 기존의 편집 거리 알고리즘에서 문자의 일치유무에 따라 단순히 0 또는 1을 부여하는 것은 부정확하다. 따라서 본 논문은 편집 거리 알고리즘의 수정 연산 중 대체 연산 비용 계산 시 항목 분류 트리를 사용하여 연산 비용이 0 에서 1 사이의 값을 가지도록 세분화하였다. 실험 결과 제안 방법은 대체 연산 비용 계산 시 두 문자가 다르면 단순히 1 을 부여하는 기존의 편집 거리 알고리즘에 비해 시퀀스 간의 유사도를 더 정확하게 계산함을 확인하였다.

A*를 이용하는 전술적 경로찾기에서 휴리스틱 성능비교 (Comparison of Heuristics in Tactical path-finding Using A*)

  • 김경혜;조수진;설정아;유견아
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 추계학술발표대회
    • /
    • pp.486-489
    • /
    • 2010
  • 전술적 경로찾기에서는 거리나 시간 요소 외에 여러 가지 전술적 요소를 포함한 비용 함수를 사용하여 경로를 탐색한다. 경로찾기에서 가장 많이 이용되는 A* 알고리즘의 경우, 현재 노드에서 목표까지의 추정값을 의미하는 휴리스틱 함수를 이용하는데 대표적인 허용가능 휴리스틱(admissible heuristic)인 유클리디안 거리(Euclidean distance)를 전술적 경로찾기에서 이용하는 경우, 탐색 성능이 저하되는 단점이 있다. 이는 거리이외에 전술적 요소까지 더해진 실제 비용에 비해 직선 거리만을 고려한 휴리스틱 값이 현저하게 작은데 기인한다. 그러므로 본 논문에서는 A*를 이용하는 경로찾기에서 탐색의 성능을 향상시킬 수 있는 두 가지 휴리스틱을 제안하고 이들의 허용성을 분석하고 방문 노드수 비교를 통해 탐색 성능을 비교한다.

심리전기적 정보(Psychobiographical Information)가 정신질환자에 대한 태도변화에 미치는 효과 (The Effect of Psychobiographical Information on Attitude Change toward Mentally Ill People)

  • 강상현;손정락
    • 디지털융복합연구
    • /
    • 제15권2호
    • /
    • pp.451-457
    • /
    • 2017
  • 본 연구는 정신질환자에 대한 태도변화에 있어 심리전기적 정보가 가지는 효과성을 알아보기 위한 것이었다. 이를 위해 대학생 30명을 심리전기적 정보를 제공 받은 집단과 정신병리적 정보를 제공 받은 집단에 무선 배정하였다. 실험 참가자들은 처치 정보를 제공 받기 이전에 알코올 중독자 사례에 대한 설명을 5분가량 들었고, 태도변화에 대한 측정치는 호감도, 신뢰도, 사회적 거리감이었다. 연구결과 집단 간에는 사회적 거리감에서만 의미 있는 차이가 확인되었다. 집단내에서는 정신병리적 정보 집단의 경우 호감도에서만 의미 있는 변화가 있었던 것과 대조적으로 심리전기적 제공 집단에서는 호감도, 신뢰도, 사회적 거리감 모두 의미 있는 변화가 나타났다. 이러한 결과는 정신질환자에 대한 태도변화에 심리전기적 접근이 효과적일 수 있음을 경험적으로 확인했다는 점에서 의의가 있다.

계량화된 지식 추상화 계층을 이용한 협력적 질의 처리 (Cooperative Query Answering Using the Metricized Knowledge Abstraction Hierarchy)

  • 신명근
    • 한국컴퓨터정보학회논문지
    • /
    • 제11권3호
    • /
    • pp.87-96
    • /
    • 2006
  • 데이터베이스 시스템에서 협력적 질의응답이란 질의 내용과 정확히 일치하는 자료뿐만 아니라 좀 더 넓은 인근 범위의 자료 또는 근사적인 자료를 검색해 주는 것을 말한다. 협력적 질의응답은 질의 분석, 질의 유연화, 유연화된 질의에 따른 근사적 자료 제공의 세 단계로 이루어져 있다. 질의 유연화를 수행하기 위해 의미적 관계를 표현하는 지식추상화 방법과 자료 사이의 정량적인 유사도를 거리로 표현하는 방법들이 지식표현 방법으로 사용된다. 본 논문에서는 보다 효과적으로 질의 유연화 단계를 지원하기 위해, 다단계 데이터 추상화 계층과 거리 척도를 지원하는 계량화된 지식추상화 계층(MKAH: Metricized Knowledge Abstraction Hierarchy)을 제안한다. MKAH는 카테고리화 될 수 있는 자료에 대해 질의 유연화를 효과적으로 지원하며 두 값 사이의 정량적인 의미상의 유사도를 제공하여, 질의 결과에 순위가 매겨질 수 있도록 한다. MKAH의 실용성과 효율성을 검증하기 위하여 경력직 검색 분야에 대한 원형 시스템을 구현해보았다. 다양한 실험을 통하여 MKAH가 풍부한 의미 표현이 가능하면서 질적으로도 높은 거리 척도를 제공해 준다는 것을 보였다. 그 결과 MKAH를 채택하는 도메인은 다른 정량적인 숫자 도메인과 호환될 수 있다는 점과, 큰 규모의 시스템을 만드는 데에도 장점이 있음을 확인하였다.

  • PDF

환경정비형 지구단위계획의 효과분석 - 건대앞 노유거리, 성신여대앞 하나로거리, 이대앞 찾고싶은거리를 중심으로 - (A Post Assessment of Streetscape Improvement Projects Based on District Unit Plans)

  • 강준모;박현신
    • 대한토목학회논문집
    • /
    • 제30권1D호
    • /
    • pp.89-98
    • /
    • 2010
  • 본 연구는 지금까지 시행된 환경정비형 지구단위계획의 시행사례인 "건대앞 노유거리, 성신여대입구 하나로거리 이대앞 찾고싶은거리"를 분석함으로써 환경정비형 지구단위계획의 성과 및 한계와 앞으로 나아갈 방향에 대하여 고찰하는데 그 목적이 있다. 건대앞 노유거리계획과 성신여대 앞 하나로거리계획은 환경정비형 지구단위계획이 처음 시행된(건대 앞 노유거리 : 2001년, 성신여대 앞 하나로거리: 2002년) 의미 있는 거리이며 이후 2005년 시행된 이대 앞 찾고싶은거리 환경정비형 지구단위계획의 경우 앞서 시행된 두 환경정비형 지구단위계획에서 확인된 문제점을 보완하여 시행된 측면이 있어 앞의 2개 사업과의 비교를 위하여 함께 분석을 실시하였다. 환경정비형 지구단위계획에 의한 사업은 물리적 가로환경변화에 초점을 맞춰 거리이용특성, 가로시설물, 가로입면의 3가지 측면에서의 내용을 중심으로 분석하였으며, 이러한 계획에 의한 사업 효과 분석은 사업 전 후 현황을 환경정비형 지구단위계획의 시행지침에 제시된 3가지 목표의 (목표1. 상점 및 필지별 개보수와 연계할 수 있는 환경개선, 목표2. 이용방식의 개선을 통한 환경개선, 목표3. 서울시 및 자치구의 공공사업과 연계한 설계대상) 달성 수준을 중심으로 분석하였다.

COG 거리와 유전자 간의 상대 위치정보를 이용한 오페론 예측 전처리 모델 (Preprocessing Model for Operon Prediction Using Relative Distance of Genes and COG Distance)

  • Chun, Bong-Kyung;Jang, Chul-Jin;Kang, Eun-Mi;Cho, Hwan-Gue
    • 한국생물정보학회:학술대회논문집
    • /
    • 한국생물정보시스템생물학회 2003년도 제2차 연례학술대회 발표논문집
    • /
    • pp.210-219
    • /
    • 2003
  • 오페론(operon)은 보통 미생물에서 다수의 인접한 유전자들로 구성된 그룹으로 하나의 유전자처럼 공통된 프로모터에 의해 전사되는 단위이다. 오페론을 구성하는 유전자들은 기능적으로 서로 유사하거나 같은 물질대사경로(metabolic pathway) 상에 존재하는 특징을 지니기 때문에 이들은 중요한 의미를 가지며, 미생물 유전체 분석에서 오페론을 구성하는 유전자들을 예측하는 것은 상당히 중요하다. 오페론을 예측하는 이전 연구들로는 이미 알려진 오페론의 특징인 유전자간 거리나 오페론을 구성하는 평균 유전자 개수 등을 이용하는 방법, 마이크로어레이 발현 실험을 이용한 방법, 전유전체(whole genome)들 간의 보존된 유전자 집합(conserved gene cluster)을 이용한 방법 그리고 물질대사경로를 이용한 방법 등이 있다. 본 논문에서는 COG 기능(function) 거리, 유전자 간의 거리, 코돈 사용빈도(codon usage) 그리고COG 기능 거리와 유전자간 거리를 같이 적용한 방법을 이용하여 오페론 예측을 위한 전처리 모델을 생성하였다 전처리 모델을 E. coli 전유전체에 적용해본 결과, 알려진 오페론들의 약 90%가 이를 포함하였다. 따라서 본 논문에서 제시한 전처리 모델은, 추후 오페론 예측을 위한 좋은 도구로 활용할 수 있을 것이다.

  • PDF

웹에서의 남서울 대학교 동창회 설계구현 (A meeting of alumni association Plan on Web)

  • 정지문;전현준;최성
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2000년도 추계학술대회
    • /
    • pp.375-378
    • /
    • 2000
  • PC 통신에서 주로 이루어지던 Community의 활성화가 점차 거대한 Network으로 구성된 인터넷으로 그 자리를 옮기고 있다. Community의 활성화는 기존의 Off-line에서 이루어진 공동체 의식을 점차 사이버 환경에서 이루어지게 한 것을 의미하며 이는 현실 상 먼 거리에 위치한 서로 다른 User들을 사이버라는 새로운 환경에서 동호회를 통해 서로의 공통된 주제에 대해 의견을 나눌 수 있음을 의미하는 것이다. 본 논문은 이러한 동호회의 성격을 띈 사이버 동창회를 만들기 위한 설계 및 운영방안 그리고 나아가서는 구현에 필요한 웹 프로그래밍에 대해 논의하고자 한다.

유사구조 및 유사의미 문장 생성 방법 (Semantic and Syntax Paraphrase Text Generation)

  • 서혜인;정상근;정지수
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.162-166
    • /
    • 2020
  • 자연어 이해는 대화 인터페이스나 정보 추출 등에 활용되는 핵심 기술 중 하나이다. 최근 딥러닝을 활용한 데이터 기반 자연어 이해 연구가 많이 이루어지고 있으며, 이러한 연구에 있어서 데이터 확장은 매우 중요한 역할을 하게 된다. 본 연구는 자연어 이해영역에서의 말뭉치 혹은 데이터 확장에 있어서, 입력으로 주어진 문장과 문법구조 및 의미가 유사한 문장을 생성하는 새로운 방법을 제시한다. 이를 위해, 우리는 GPT를 이용하여 대량의 문장을 생성하고, 문장과 문장 사이의 문법구조 및 의미 거리 계산법을 제시하여, 이를 이용해 가장 유사하지만 새로운 문장을 생성하는 방법을 취한다. 한국어 말뭉치 Weather와 영어 말뭉치 Atis, Snips, M2M-Movie M2M-Reservation을 이용하여 제안방법이 효과적임을 확인하였다.

  • PDF

심층적 의미 매칭을 이용한 cQA 시스템 질문 검색 (Question Retrieval using Deep Semantic Matching for Community Question Answering)

  • 김선훈;장헌석;강인호
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2017년도 제29회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.116-121
    • /
    • 2017
  • cQA(Community-based Question Answering) 시스템은 온라인 커뮤니티를 통해 사용자들이 질문을 남기고 답변을 작성할 수 있도록 만들어진 시스템이다. 신규 질문이 인입되면, 기존에 축적된 cQA 저장소에서 해당 질문과 가장 유사한 질문을 검색하고, 그 질문에 대한 답변을 신규 질문에 대한 답변으로 대체할 수 있다. 하지만, 키워드 매칭을 사용하는 전통적인 검색 방식으로는 문장에 내재된 의미들을 이용할 수 없다는 한계가 있다. 이를 극복하기 위해서는 의미적으로 동일한 문장들로 학습이 되어야 하지만, 이러한 데이터를 대량으로 확보하기에는 어려움이 있다. 본 논문에서는 질문이 제목과 내용으로 분리되어 있는 대량의 cQA 셋에서, 질문 제목과 내용을 의미 벡터 공간으로 사상하고 두 벡터의 상대적 거리가 가깝게 되도록 학습함으로써 의사(pseudo) 유사 의미의 성질을 내재화 하였다. 또한, 질문 제목과 내용의 의미 벡터 표현(representation)을 위하여, semi-training word embedding과 CNN(Convolutional Neural Network)을 이용한 딥러닝 기법을 제안하였다. 유사 질문 검색 실험 결과, 제안 모델을 이용한 검색이 키워드 매칭 기반 검색보다 좋은 성능을 보였다.

  • PDF

IT 산업계의 기술이전에 관한 연구 (A Study on Technology Transfer in IT Industry)

  • 성태경
    • 경영과정보연구
    • /
    • 제28권3호
    • /
    • pp.45-68
    • /
    • 2009
  • 본 연구는 한국의 IT 산업계에서 기술의 이전에 영향을 미치는 요인을 파악하고, 파악된 요인에 기술 이전의 성공에 미치는 영향력을 조사하며, IT 산업계의 성공적인 기술 이전을 위한 전략을 제시하는 데 그 목적이 있다. 기술의 이전에 영향을 미치는 주요 요인들로는 대화, 거리, 모호성, 동기를 들 수 있다. 대화는 기술을 얼마나 정확하고 효율적으로 전달할 수 있는가 그리고 전달매체의 충분성을 의미한다. 연구개발자와 이를 상용화하는 사용자간의 대화정도를 측정하는 것으로 아주 수동적에서 아주 능동적으로 평가할 수 있다. 거리는 전달자와 수신자와의 물리적 그리고 문화적 차이를 의미한다. 최근 전달자와 수신자 사이의 문화적(가치, 판단기준, 태도, 교육, 환경 등) 차이에 대한 중요성이 점차 대두되고 있다. 모호성은 이전하고자 하는 기술이 얼마나 구체적이고 분명한가를 의미한다. 모호성이 높은 기술은 이해시키기 어렵고, 이해하기 어렵고, 실현 가능성을 증명하기 어렵게 때문에 이전이 용이하지 않다. 동기는 기술의 이전을 하여야 할 동기가 부여되거나 아니면 이를 유도할 유인책이 있는가를 의미한다. 기술 이전 준거틀은 기술의 이전에 영향을 미치는 주요 요인들(대화, 거리, 모호성, 동기)의 조합으로 나타낸 것이다. 각 격자는 4가지 경우를 나타내는데, 격자 I과 IV는 기술의 이전이 완벽한 상황과 불가능한 상황을 의미하며, 격자 III과 IV는 기술의 이전에 영향을 미치는 요소가 복합하여 강점과 약점으로 작용하는 상황을 나타낸다. 기술 이전 준거틀에서 가장 기술 이전의 가능성이 높은 격자를 성취하기 위해서는 적절한 기술 이전 전략의 수립 및 집행이 중요하다고 할 수 있다. 따라서 정부는 물론 유관기관 및 기술 이전 추진 조직은 기술 이전에 영향을 미치는 주요 요인을 최적화하는 대안 개발에 초점을 맞추어야 할 것이다.

  • PDF