• Title/Summary/Keyword: 정보검색능력

Search Result 312, Processing Time 0.028 seconds

Biomarker Detection of Specific Disease using Word Embedding (단어 표현에 기반한 연관 바이오마커 발굴)

  • Youn, Young-Shin;Kim, Yu-Seop
    • Annual Conference on Human and Language Technology
    • /
    • 2016.10a
    • /
    • pp.317-320
    • /
    • 2016
  • 기계학습 기반의 자연어처리 모듈에서 중요한 단계 중 하나는 모듈의 입력으로 단어를 표현하는 것이다. 벡터의 사이즈가 크고, 단어 간의 유사성의 개념이 존재하지 않는 One-hot 형태와 대조적으로 유사성을 표현하기 위해서 단어를 벡터로 표현하는 단어 표현 (word representation/embedding) 생성 작업은 자연어 처리 작업의 기계학습 모델의 성능을 개선하고, 몇몇 자연어 처리 분야의 모델에서 성능 향상을 보여 주어 많은 관심을 받고 있다. 본 논문에서는 Word2Vec, CCA, 그리고 GloVe를 사용하여 106,552개의 PubMed의 바이오메디컬 논문의 요약으로 구축된 말뭉치 카테고리의 각 단어 표현 모델의 카테고리 분류 능력을 확인한다. 세부적으로 나눈 카테고리에는 질병의 이름, 질병 증상, 그리고 난소암 마커가 있다. 분류 능력을 확인하기 위해 t-SNE를 이용하여 2차원으로 단어 표현 결과를 맵핑하여 가시화 한다. 2차원으로 맵핑된 결과 값을 코사인 유사도를 사용하여 질병과 바이오 마커간의 유사도를 구한다. 이 유사도 결과 값 상위 20쌍의 결과를 가지고 실제 연구가 되고 있는지 구글 스콜라를 통해 관련 논문을 검색하여 확인하고, 검색 결과를 점수화 한다. 실험 결과 상위 20쌍 중에서 85%의 쌍이 실제적으로 질병과 바이오 마커 간의 관계를 파악하는 방향으로 진행 되고 있으나, 나머지 15%의 쌍에 대해서는 실질적인 연구가 잘 되고 있지 않은 것으로 파악되었다.

  • PDF

Generative Model Utilizing Multi-Level Attention for Persona-Grounded Long-Term Conversations (페르소나 기반의 장기 대화를 위한 다각적 어텐션을 활용한 생성 모델)

  • Bit-Na Keum;Hong-Jin Kim;Jin-Xia Huang;Oh-Woog Kwon;Hark-Soo Kim
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.281-286
    • /
    • 2023
  • 더욱 사람같은 대화 모델을 실현하기 위해, 페르소나 메모리를 활용하여 응답을 생성하는 연구들이 활발히 진행되고 있다. 다수의 기존 연구들에서는 메모리로부터 관련된 페르소나를 찾기 위해 별도의 검색 모델을 이용한다. 그러나 이는 전체 시스템에 속도 저하를 일으키고 시스템을 무겁게 만드는 문제가 있다. 또한, 기존 연구들은 페르소나를 잘 반영해 응답하는 능력에만 초점을 두는데, 그 전에 페르소나 참조의 필요성 여부를 판별하는 능력이 선행되어야 한다. 따라서, 우리의 제안 모델은 검색 모델을 활용하지 않고 생성 모델의 내부적인 연산을 통해 페르소나 메모리의 참조가 필요한지를 판별한다. 참조가 필요하다고 판단한 경우에는 관련된 페르소나를 반영하여 응답하며, 그렇지 않은 경우에는 대화 컨텍스트에 집중하여 응답을 생성한다. 실험 결과를 통해 제안 모델이 장기적인 대화에서 효과적으로 동작함을 확인하였다.

  • PDF

A Survey Research on Information Literacy Level in Korean University Students (우리나라 대학생의 정보 리터러시 수준에 대한 실태조사)

  • Lee, Soo-Sang
    • Journal of the Korean Society for Library and Information Science
    • /
    • v.41 no.1
    • /
    • pp.85-103
    • /
    • 2007
  • Information literacy which is related various forms of literacy can be defined as a vital competency of individuals in digital based knowledge information society. This basic survey research is aimed to assess information literacy level of the undergraduate students. For this study a proper model of information literacy is used which based 5 Performance processes and 12 performance abilities. The result of this survey is as follows: 1) Among the S performance process elements.'result evaluation' element showed high level competency than other elements. 2) There were high correlations within performance Process elements and performance ability elements. 3) Those items such as academic grade, first experience of information retrieval, and experience of information literacy instruction affect the difference in the level of information literacy.

Learning User Profile with Reinforcement Learning (강화학습 기반 사용자 프로파일 학습)

  • 김영란;한현구
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10d
    • /
    • pp.325-327
    • /
    • 2002
  • 정보검색 태스크에서 사용자 모델링의 목적은 관련정보 검색을 용이하게 해주기 위하여 사용자의 관심도 또는 필요정보의 모델을 학습하는 것으로 시간적인 속성(temporal characteristics)을 가지며 관심 이동을 적절하게 반영하여야 한다. 강화학습은 정답이 주어지지 않고 사용자의 평가만이 수치적으로 주어지는 환경에서 평가를 최대화 한다는 목표를 가지므로 사용자 프로파일 학습에 적용할 수 있다. 본 논문에서는 사용자가 문서에 대해 행하는 일련의 행위를 평가값으로 하여 사용자가 선호하는 용어를 추출한 후, 사용자 프로파일을 강화학습 알고리즘으로 학습하는 방법을 제안한다. 사용자의 선호도에 적응하는 능력을 유지하기 위하여 지역 최대값들을 피할 수 있고, 가장 좋은 장기간 최적정책에 수렴하는 R-Learning을 적용한다. R-learning은 할인된 보상값의 최적화보다 평균 보상값을 최적화하기 때문에 장기적인 사용자 모델링에 적합하다는 것을 제시한다.

  • PDF

Enhanced Architecture Based Efficient Personalized Web Browing for Pocket PC Environment (Pocket PC 환경에서의 향상된 아키텍처 기반의 효율적인 개인화 웹 브라우징)

  • Han, Seung-Hyun;Ryu, Dong-Yub;Oh, Hae-Seok
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.11b
    • /
    • pp.1567-1570
    • /
    • 2002
  • PDA(Personal Digital Assistant)와 같은 Mobile 이동통신기기를 사용한 인터넷 쇼핑은 향후 E-Commerce 시장에서 가장 크게 확산되어질 한 분야로 부상되고 있다. 그러나 현재 인터넷상에 혼재 되어있는 수많은 정보에 대하여 Pocket PC 환경상의 제한된 Screen Size와 느린 통신 속도, 무선 인터넷 접속시의 높은 비용, 저장능력의 한계 등의 문제로 웹 브라우징을 통한 다량의 웹 데이터에 대한 확인과 검색이 어렵고, 사용자가 원하지 않는 정보 또한 산재되어 있어 개인화된 검색 서비스의 요구가 대두되고 있다. 본 연구에서는 PDA 및 Pocket PC를 이용하는 사용자의 관심도를 기준으로 보다 편리하고 효율적인 개인화 Interface의 제공 및 이를 이용한 손쉬운 웹 브라우징 방식을 제시한다. 또한 User 인터랙션 정보를 통해 피드백 함으로써 보다 완벽하게 사용자 개인별 취향에 접근할 수 있는 브라우징 기법을 제시한다.

  • PDF

A Design and Implementation of Dynamic Hybrid P2P System with Group Management and Maintenance of Reliability (그룹관리와 신뢰성을 위한 Dynamic Hybrid P2P시스템 설계 및 구현)

  • 이석희;양일등;김성열
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.04d
    • /
    • pp.406-408
    • /
    • 2003
  • 현재 많이 사용되고 있는 P2P 개념으로는 순수 F2P와 변형 F2P구조가 있다. 순수 P2P의 모델에는 Gnutella와 Ktella 등의 형태가 존재하고 변형 P2P로는 무수히 많은 형태가 존재한다. 순수 P2P 모델의 경우에는 정보 공유에서 연결성을 장점으로 Gnutella의 형태를 응용한 형태로 많이 사용되고 있지만 정보를 검색하거나 제공하기 위해 많은 트래픽을 소모하게 된다. 이와는 달리 변형 P2P모델들 중 정보 공유 모델들이 존재하는데 이 모델들은 사용자에게 효율적이고 빠른 검색과 색인을 제공하기 위해 기존의 서버/클라이언트 형태를 취하고 있지만 제공하는 서버의 능력에 의존할 수 밖에 없다. 파일공유 모델의 Peer들에 대해 연결성 유지를 위한 많은 부하와 사용자에 있어서 그룹에 대한 형태의 문제점 그리고 서버의 Fail로 인한 비 연결성에 대한 문제점을 해결하기 위해 본 논문에서는 라우팅 프로토콜 기법에서의 접근과 계층적 구조를 적용하고 Backup 시스템을 포함해서 효율적인 그룹관리와 동적인 서버의 지정으로 신뢰성을 유지하기 위한 시스템을 설계하고 구현하였다.

  • PDF

Question Answering that leverage the inherent knowledge of large language models (거대 언어 모델의 내재된 지식을 활용한 질의 응답 방법)

  • Myoseop Sim;Kyungkoo Min;Minjun Park;Jooyoung Choi;Haemin Jung;Stanley Jungkyu Choi
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.31-35
    • /
    • 2023
  • 최근에는 질의응답(Question Answering, QA) 분야에서 거대 언어 모델(Large Language Models, LLMs)의 파라미터에 내재된 지식을 활용하는 방식이 활발히 연구되고 있다. Open Domain QA(ODQA) 분야에서는 기존에 정보 검색기(retriever)-독해기(reader) 파이프라인이 주로 사용되었으나, 최근에는 거대 언어 모델이 독해 뿐만 아니라 정보 검색기의 역할까지 대신하고 있다. 본 논문에서는 거대 언어 모델의 내재된 지식을 사용해서 질의 응답에 활용하는 방법을 제안한다. 질문에 대해 답변을 하기 전에 질문과 관련된 구절을 생성하고, 이를 바탕으로 질문에 대한 답변을 생성하는 방식이다. 이 방법은 Closed-Book QA 분야에서 기존 프롬프팅 방법 대비 우수한 성능을 보여주며, 이를 통해 대형 언어 모델에 내재된 지식을 활용하여 질의 응답 능력을 향상시킬 수 있음을 입증한다.

  • PDF

Degrees of Understanding Regarding Information Literacy in Korean University Students (우리나라 대학생들의 정보활용능력 인식도에 관한 연구)

  • Lee, Hyun-Sil;Choi, Sang-Ki
    • Journal of the Korean BIBLIA Society for library and Information Science
    • /
    • v.16 no.1
    • /
    • pp.91-112
    • /
    • 2005
  • This is a survey study to measure degrees of understanding regarding Information literacy in Korean university students based on ACRL standards. In the results of the survey there were no meaningful differences between individuals age, gender, major, and University. There were also no meaningful difference between the five ACRL standards. However, there were meaningful differences between the performance indicators in each standard. For example in the first standard, the performance indicator 'Determines the nature and extent of the information needed', had the highest score. had the lowest score. In the second ‘Effective Access of Information', had the highest score. In the third ‘Evaluate and Incorporate Information', had the highest score>and had the lowest score. In the fourth ‘Use of Information', , had the highest score. In the last ‘Information Ethics', there was no meaningful difference. This study also showed outcomes regarding the details in each standard.

  • PDF

P2P Group Routing Algorithm based on Sensor Data (센서 데이터 기반 P2P 그룹 라우팅 알고리즘)

  • Kim, Boon-Hee
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2013.05a
    • /
    • pp.411-412
    • /
    • 2013
  • 유비쿼터스 기반 기술은 기존의 다양한 장치 및 서비스를 기반으로 발전되고 있다. 분산 시스템의 효율적인 활용에 쓰이는 P2P 기술은 유무선 네트워크로 연결된 환경에서 보유한 자원을 효율적으로 공유하는 측면에서 활용되고 있다. 유비쿼터스 환경에서 무수히 많은 센서를 기반으로 USN 기반을 구축할 수 있는데, 센서 데이터 자체의 정보양은 일반적인 P2P 기술에서 전송되는 정보양에 비하면 매우 적다. 그러나 센서 자체가 일반 P2P 네트워크의 단독 노드로써의 역할을 한다고 보았을 때 컴퓨팅 능력은 매우 미미한 것이다. 이러한 환경에서 하나의 노드에서 목적지 센서 노드로의 빠른 데이터 전송이 요구됨으로 그와 관련된 연구가 필요하다. P2P 시스템의 고유의 특성상 자원 검색, 전송, 재전송 작업이 이뤄질 때마다 네트워크 트래픽이 과다하게 발생되는 단점을 갖고 있는데, USN으로 한정된 환경에서는 이러한 고유의 특징이 시스템의 중요 문제로 인식되지 않는다. 따라서 이를 가정치로 두고 효과적인 데이터 전송을 위한 라우팅 알고리즘을 제안한다.

A Study on Contents-based Retrieval using Wavelet (Wavelet을 이용한 내용기반 검색에 관한 연구)

  • 강진석;박재필;나인호;최연성;김장형
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.4 no.5
    • /
    • pp.1051-1066
    • /
    • 2000
  • According to the recent advances of digital encoding technologies and computing power, large amounts of multimedia informations such as image, graphic, audio and video are fully used in multimedia systems through Internet. By this, diverse retrieval mechanisms are required for users to search dedicated informations stored in multimedia systems, and especially it is preferred to use contents-based retrieval method rather than text-type keyword retrieval method. In this paper, we propose a new contents-based indexing and searching algorithm which aims to get both high efficiency and high retrieval performance. To achieve these objectives, firstly the proposed algorithm classifies images by a pre-processing process of edge extraction, range division, and multiple filtering, and secondly it searches the target images using spatial and textural characteristics of colors, which are extracted from the previous process, in a image. In addition, we describe the simulation results of search requests and retrieval outputs for several images of company's trade-mark using the proposed contents-based retrieval algorithm based on wavelet.

  • PDF