• 제목/요약/키워드: 확장검색어

검색결과 200건 처리시간 0.029초

패션앱 후기글 평가분석에 기반한 의류 검색추천 챗봇 개발을 위한 학습데이터 EVAD 구축 (Construction of Evaluation-Annotated Datasets for EA-based Clothing Recommendation Chatbots)

  • 최수원;황창회;유광훈;남지순
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.467-472
    • /
    • 2021
  • 본 연구는 패션앱 후기글에 나타나는 구매자의 의견에 대한 '평가분석(Evaluation Analysis: EA)'을 수행하여, 이를 기반으로 상품의 검색 및 추천을 수행하는 의류 검색추천 챗봇을 개발하는 LICO 프로젝트의 언어데이터 구축의 일환으로 수행되었다. '평가분석 트리플(EAT)'과 '평가기반요청 쿼드러플(EARQ)'의 구성요소들에 대한 주석작업은, 도메인 특화된 단일형 핵심어휘와 다단어(MWE) 핵심패턴들을 FST 방식으로 구조화하는 DECO-LGG 언어자원에 기반하여 반자동 언어데이터 증강(SSP) 방식을 통해 진행되었다. 이 과정을 통해 20여만 건의 후기글 문서(230만 어절)로 구성된 EVAD 평가주석데이터셋이 생성되었다. 여성의류 도메인의 평가분석을 위한 '평가속성(ASPECT)' 성분으로 14가지 유형이 분류되었고, 각 '평가속성'에 연동된 '평가내용(VALUE)' 쌍으로 전체 35가지의 {ASPECT-VALUE} 카테고리가 분류되었다. 본 연구에서 구축된 EVAD 평가주석 데이터의 성능을 평가한 결과, F1-Score 0.91의 성능 평가를 획득하였으며, 이를 통해 향후 다른 도메인으로의 확장된 적용 가능성이 유효함을 확인하였다.

  • PDF

정보검색을 위한 자연언어 질의어의 불리언 질의로의 변환 (A System for converting natural language queries Into boolean queries for Information Retrieval)

  • 서광준;최기선;나동열
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1994년도 제11회 음성통신 및 신호처리 워크샵 논문집 (SCAS 11권 1호)
    • /
    • pp.258-261
    • /
    • 1994
  • 자연언어 인터페이스는 초보자나 비숙련가의 입장에서는 새로운 시스템의 적응에 있어서 어떤 학습도 필요하지 않다는 장점이 있다. 이 연구에서는 불리언 질의를 처리하는 정보검색 시스템의 자연언어 인터페이스를 구혐하였다. 즉, 한국어 자연언어 질의를 불리언 질의로 변환해주는 시스템이다. 접근 방법은 먼저 자연언어 질의를 구문 해석한 후에, 그 결과인 문자의 의존 구조와 불용어 정보를 사용하여 기본적인 불리언 질의를 만든다음, 시소러스를 이용하여 불리언 질의를 확장한다. 여기에서 사용한 구문 해석 방법은 기존 문법에 기반한 방법이다. 변환 시스템은 SPARC-II 호환기종에서 구현되었으며, 약 5만 단어의 사전을 사용한다. 가공된 120 개의 질의를 대상으로 실험한 결과, 전체 소요시간은 13.5초가 걸렸다. 그리고, 변환된 불리언 연산식중에 110개가 적절하게 변환된 것으로 조사되었다.

  • PDF

불리언 질의 최적화에 관한 연구 (A Study on Boolean Query Optimization in Information Retrieval)

  • 주원균;이민호;강무영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 추계학술발표논문집 (하)
    • /
    • pp.1879-1882
    • /
    • 2002
  • 본 논문에서는 불리언 모델을 지원하는 정보검색 시스템에서 사용자로부터 입력받은 불리언 질의를 효율적으로 연산하기 위한 3 가지 방법을 제안한다. 첫째, 불리언 대수를 사용하여 형태적으로 불필요한 노드를 제거한다. 둘째 색인어 출현 빈도 정보를 사용함으로써 빈도 0 을 가지는 노드와 이를 포함하는 노드의 연산 제외 여부를 결정하고, 연산 수행 시 시간이 적게 걸리는 순으로 피 연산자와 연산자의 순서를 재배열한다. 셋째, 불리언 질의 내에 복합 명사가 포함되어 있을 경우 구성 명사와 연산자의 조합을 이용한 질의 확장을 실시한다. 처음 두 가지 방법은 검색 속도의 향상을, 세 번째 방법은 정확도의 향상을 목표로 한다.

  • PDF

적합성 피드백을 이용한 자동 음차표기의 성능향상 기법 (Improving English-to-Korean Transliteration through Automatic Relevance Feedback)

  • 오종훈;최기선
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (1)
    • /
    • pp.805-807
    • /
    • 2004
  • 음차표기란 외국어의 단어를 글자나 발음을 이용하여 자국어로 표기하는 것으로 정의된다. 자동음차표기는 기계번역과 정보검색 등의 자연언어처리 응용에서 사용된다. 기계번역에서는 번역사전에 등재되어 있지 않은 고유명사나 전문용어를 번역하는 방법으로 사용되며, 정보검색에서는 단어불일치 문제의 해결과 질의확장 등에 사용된다. 하지만 지금까지의 영-한 자동 음차표기 연구들은 대부분 주어진 원어에 대하여 가장 적합한 음차표기를 생성하는 연구에 초점을 맞추었다. 또한, 원어로부터 가능한 음차표기를 파악하는 연구에서도 해당 음차표기에 대한 적합성을 파악하지 않고 단순 리스트형태로 음차표기를 생성함으로써, 음차표기생성 결과에 대한 품질이 낮았다. 본 논문에서는 이러한 문제점을 해결하기 위하여, 주어진 원어로부터 가능한 음차표기를 생성하고 이들에 대한 적합성을 자동으로 파악하는 음차표기 모델을 제안한다. 본 논문의 기법은 약 72%의 단어 정확률을 나타내었으며 기존의 기법보다 최고 31%의 성능향상을 나타내었다.

  • PDF

단어연상검사법을 이용한 탐색 시소러스 구축에 관한 실험적 연구 (Searching Thesaurus Construction with Word Association Test: A Pilot Study)

  • 한승희
    • 한국문헌정보학회지
    • /
    • 제40권3호
    • /
    • pp.289-304
    • /
    • 2006
  • 본 연구에서는 단어의 의미연상을 이용하여 시소러스를 구축하고. 이 시소러스에 대해 탐색 시소러스로서의 기능성을 확인하기 위해 질의확장 실험을 수행하였다 연상 시소러스 구축을 위해 문헌정보학 분야를 대상으로 단어연상검사를 실시한 후 자극어와 반응어간의 의미관계를 파악하고 반응어와 기존 시소러스의 디스크립터를 비교 분석하였다. 실험 및 분석결과. 단어연상검사를 이용하여 시소러스를 구축하면 기존의 시소러스에 비해 연관관계 용어들을 시소러스에 다양하게 반영할 수 있으며, 통제어휘집에 나타난 하위관계와 동등관계 용어들을 어느 정도 반영할 수 있다는 것을 확인하였다. 또한 질의확장 실험결과 단어연상 시소러스가 기존 시소러스에 비해 비교적 우수한 성능을 보여 단어연상 시소러스가 정보검색환경에서 질의 확장에 응용될 수 있음을 증명하였다.

감정 분류를 위한 한국어 감정 자질 추출 기법과 감정 자질의 유용성 평가 (A Korean Emotion Features Extraction Method and Their Availability Evaluation for Sentiment Classification)

  • 황재원;고영중
    • 인지과학
    • /
    • 제19권4호
    • /
    • pp.499-517
    • /
    • 2008
  • 본 논문에서는 한국어 감정 분류에 기반이 되는 감정 자질 추출의 효과적인 추출 방법을 제안하고 평가하여, 그 유용성을 보인다. 한국어 감정 자질 추출은 감정을 지닌 대표적인 어휘로부터 시작하여 확장할 수 있으며, 이와 같이 추출된 감정 자질들은 문서의 감정을 분류하는데 중요한 역할을 한다. 문서 감정 분류에 핵심이 되는 감정 자질의 추출을 위해서는 영어 단어 시소러스 유의어 정보를 이용하여 자질들을 확장하고, 영한사전을 이용하여 확장된 자질들을 번역하여 감정 자질들을 추출하였다. 추출된 한국어 감정 자질들을 평가하기 위하여, 이진 분류 기법인 지지 벡터 기계(Support Vector Machine)를 사용해서 한국어 감정 자질로 표현된 입력문서의 감정을 분류하였다. 실험 결과, 추출된 감정 자질을 사용한 경우가 일반적인 정보 검색에서 사용하는 내용어(Content Word) 기반의 자질을 사용한 경우보다 약 14.1%의 성능 향상을 보였다.

  • PDF

학습 객체를 기반으로 한 객체 지향 데이터베이스 시스템의 설계 (The Modeling of Object oriented Database basesed E-learning Object)

  • 김준모
    • 한국컴퓨터산업학회논문지
    • /
    • 제5권9호
    • /
    • pp.941-946
    • /
    • 2004
  • 기존의 객체지향 데이터베이스에 학습 객체에 기반을 둔 새로운 클래스를 도입한 확장된 객체 지향 데이터 베이스의 모델을 설계한다. 이를 구현하기 위해 기존의 객체 데이터 베이스에 학습객체클래스를 도입하였으며, 이 클래스들을 연산하기 위한 학습객체 연산 클래스를 설계하였다. 그리고 확장된 객체 지향의 데이터 모델상에서 데이터베이스에 저장된 학습객체의 경험적 분류 모델에 기반을 둔 검색이 가능한 질의어를 설계하였다.

  • PDF

경험적 분류 클레스를 도입한 객체 지향 데이터베이스 모델링 (The Modeling of Object oriented Database introducting Heurilistic Classfication Class)

  • 김준모
    • 한국컴퓨터산업학회논문지
    • /
    • 제4권4호
    • /
    • pp.607-612
    • /
    • 2003
  • 기존의 객체지향 데이터베이스에 경험적 분류 모델에 기반을 둔 새로운 클래스를 도입한 확장된 객체 지향 데이터베이스의 모델을 설계한다. 이를 구현하기 위해 기존의 객체 데이터 베이스에 경험적 분류 클래스를 도입하였으며, 이 클래스들을 연산하기 위한 경험적 분류 연산 클래스를 설계하였다. 그리고 확장된 객체 지향의 데이터 모델 상에서 데이터베이스에 저장된 데이터의 경험적 분류 모델에 기반을 둔 검색이 가능한 질의어를 설계하였다.

  • PDF

좌우접속정보를 이용한 명사추출기 (A Noun Extractor using Connectivity Information)

  • 안동언
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1999년도 제11회 한글 및 한국어 정보처리 학술대회 및 제1회 형태소 분석기 및 품사태거 평가 워크숍
    • /
    • pp.173-178
    • /
    • 1999
  • 본 논문의 명사추출기는 정보검색시스템을 위한 색인어 추출기로 좌우접속정보를 이용한 형태소해석을 통하여 얻어진 형태소들 중에서 명사를 추출한다. 본 형태소해석기는 형태소해석을 위한 언어지식과 어절 분리 엔진을 분리하여 수정과 확장이 용이하게 하였다. 사용한 언어지식은 좌우접속정보로서 한 어절을 이루는 형태소들의 품사간의 접속여부를 행렬로 표현한 것이다. 어절 분리 엔진은 사전을 참조하여 한 어절에서 최장일치법에 의해 형태소를 분리하고 좌우접속정보를 참조하여 형태소 분리가 올바른지를 판단한다. 형태소들의 품사분류는 표준 태그셋을 기반으로 음절 정보를 추가하여 확장하였다. 형태소를 해석한 결과 미등록어가 발생하였을 때 미등록어에서 명사를 추정하는 모듈이 없기 때문에 재현율은 좋지 않았다.

  • PDF

강원도 동해안 지역의 어도 정보시스템 구축 (A fishway information system of the east coast at Kangwondo)

  • 이창수;최상수;박상덕;박기영
    • 한국경영과학회:학술대회논문집
    • /
    • 한국경영과학회 1997년도 추계학술대회발표논문집; 홍익대학교, 서울; 1 Nov. 1997
    • /
    • pp.21-24
    • /
    • 1997
  • 강원도 동해안 지역 하천은 유로연장과 유역면적이 작고 하천 상류부는 급경사이며 하류부는 완경사의 특징을 보여주고 있다. 이 지역 대부분의 하천이 바다로 직접 유입되고 있어 바다와 하천을 옮겨 다니는 회유성 어류가 서식하고 있으며 이들은 소하성, 강하성 및 양측성 어류로 구분된다. 이러한 회유성 어류의 이동은 동해안 지역 하천 하류부 완경사지에서 농업용수를 취수하기 위한 보의 설치로 인하여 어려워졌으며, 이러한 문제에 대처하기 위하여 수산자원 보호령(대통령령 제 5027호) 제 21조에서 어도설치를 규정하고 있다. 강원도 동해안 지역 하천에 설치되어 있는 어도의 실태를 보면 총 19개 하천에 있는 83개소의 농업용 취수보에 약 130개의 어도가 있다. 기존에 설치되어 있는 전어도에 대한 현장조사결과 어도의 기능에 장애를 일으킬 만한 원인은 어도시설의 구조적인 문제와 관리문제로 대별할 수 있다. 본 연구는 어도의 기능이 원활하게 유지되도록 어도시설물에 대한 각종 자료를 체계적으로 집적한 어도정보시스템을 구축하여 어도시설에 대한 현황파악을 용이하게 하고, 지방자치단체에서 개별적으로 수행하던 어도관리를 통합관리할수 있게 하며, 어도시설 표준모형 설계의 기초자료 및 하천 정보, 어류생태정보와 연결된 정보시스템으로의 확장을 가능하게 한다. 본 어도 정보시스템은 기본적으로 인터넷상에서 서비스가 이루어진다. 사용자는 웹 브라우저를 이용하여 어도 정보시스템이 탑재된 웹 서버에 접속하여 서비스를 요청한다. 사용자의 요청을 받은 웹 서버는 게시판과 DBMS를 제어하여 그 결과를 사용자에게 건네준다. 사용된 기술은 ISAPI 규격의 확장인 IDC, HTX이다. 관리자와 사용자의 입력, 수정, 검색, 삭제등에 관한 읽고 쓰기 권한을 구분한다.이 경과함에 따라 소멸하며 약산성에서 높은 생성능을 보임을 알 수 있었다, 강별로는 낙동강에서 THMs파 HANs의 생성능이 비교적 높았고, 영산강에서는 HAAs의 생성능이 높았다. 각 원수의 특성에 따른 생성능을 파악함으로써 생성능 저감방안을 마련하며, 소독 부산물질의 인체노출평가에 따른 위해성평가를 통해 관리기준을 설정해야 할 것이다.는 것으로 나타났다. 본 연구는 한국 문화의 특징이라 할 수 있는 교수-학생간의 인간적인 관계가 중시되는 교육환경하에서, 정보화 사회의 한 수업형태인 재택수업을 외국(특히 미국)의 방법을 그대로 따라 실시할 경우, 많은 부작용이 있을 수 있다는 것을 암시하며, 따라서 우리 교육문화에 맞는 재택수업 형태의 개발이 시급함을 제시한다고 하겠다.column density of HCaN is (1-3):n1014cm-2. Column density at distant position from MD5 is larger than that in the (:entral region. We have deduced that this hot-core has a mass of 10sR1 which i:s about an order of magnitude larger those obtained by previous studies.previous studies.업순서들의 상관관계를 고려하여 보다 개선된 해를 구하기 위한 연구가 요구된다. 또한, 준비작업비용을 발생시키는 작업장의 작업순서결정에 대해서도 연구를 행하여, 보완작업비용과 준비비용을 고려한 GMMAL 작업순서문제를 해결하기 위한 연구가 수행되어야 할 것이다.로 이루어 져야 할 것이다.태를 보다 효율적으로 증진시킬 수 있는 대안이 마련되어져야 한다고 사료된다.$\ulco

  • PDF