• 제목/요약/키워드: Candidate Words

검색결과 80건 처리시간 0.023초

검색용 MeSH 필터와 단어인접탐색 기법을 활용한 KoreaMed 검색 효율성 향상 연구 (A Study on the Retrieval Effectiveness of KoreaMed using MeSH Search Filter and Word-Proximity Search)

  • 정소나;정지나
    • 한국산학기술학회논문지
    • /
    • 제18권5호
    • /
    • pp.596-607
    • /
    • 2017
  • 의학학술문헌에는 해부학적 조직이나 기관명이 종양, 질환 또는 감염 용어들과 서로 조합하여 사용되는 언어적 특성을 가지고 있다. 의학학술문헌을 검색할 때 데이터베이스가 제공하는 통제어휘도구인 Medical Subject Headings (MeSH)를 활용하면 합성어, 동의어, 그리고 관련어를 추가로 검색할 수 있어 검색효율이 높다. 본 연구에서는 위암(Stomach Neoplasms) 어휘군을 검색용 필터로 추가하는 방법과 동시출현용어의 거리를 측정하여 단어인접탐색 기법으로 검색효율성을 향상시키는 연구를 수행하였다. 검색용 MeSH에 추가할 어휘군을 결정하기 위해 실험데이터로 PubMed에서 중심주제어가 "Stomach Neoplasms"인 2007년~2016년 논문 8,625편을 내려 받아 논문제목으로부터 Stomach와 Neoplasms 관련 용어의 동시출현여부를 분석하였다. 검색효율성은 KoreaMed에서 검색되는 MEDLINE 학술지를 대상으로 "Stomach Neoplasms"가 MeSH로 색인되어 있는 277편으로 검증하였는데 MEDLINE MeSH, MeSH on Demand, 그리고 KoreaMed MeSH Indexer의 "Stomach Neoplasms" 색인어 추출여부와 검색용 필터로 어휘군을 적용했을 때, 그리고 동시출현 용어의 단어인접검색 기법을 적용했을 때 "Stomach Neoplasms"의 매칭여부를 비교하였다. 가장 출현빈도가 높은 용어는 "Gastric Cancer"로 2,780회 출현하였다. "Gastric Adenocarcinoma", "Gastric MALT Lymphoma" 등과 같이 "Stomach" 용어와 "Neoplasms" 관련 조직학적 용어가 조합된 경우는 7,376개(88.51%)였다. 동시출현 거리가 2단어인 용어는 "Stomach"와 "Neoplasms"의 합성어로 5,234개(70.95%)였다. 연구 결과 MeSH용어를 제외하고 973개의 용어를 후보어휘군으로 선정하였다. MEDLINE MeSH와 KoreaMed MeSH Indexer의 MeSH 매칭률은 209편(75.5%)이었는데 검색필터를 적용한 결과 263편(94.9%)으로, 동시출현 용어의 13단어 단어인접탐색 기법을 적용한 경우 268편(96.7%)으로 매칭률이 향상되었다. 본 연구를 통해 자연어 검색에 있어서 검색효율을 향상시키는 수단으로 검색용 시소러스를 사용하면 색인비용에 대한 부담이 적고, 통제어의 망라적 장점과 자연어가 가지는 용어의 특정성을 유지할 수 있음을 증명하였다. 또한 불리안 검색보다는 단어인접탐색 기법을 활용하면 정확률을 높일 수 있어 검색 효율성이 향상됨을 알 수 있었다.

A Study on Technology Acceptance of Elderly living Alone in Smart City Environment: Based on AI Speaker

  • YOO, Hyun-Sil;SUH, Eung-Kyo;KIM, Tae-Hyung
    • 산경연구논집
    • /
    • 제11권2호
    • /
    • pp.41-48
    • /
    • 2020
  • Purpose: This study is to examine the intention of the elderly who live alone in the customized AI speaker for the elderly living alone to improve the quality of life service for the elderly living alone in the smart city environment. Based on the quality of life model of the elderly, this study is applied to the technology acceptance model to investigate the relationship between perceived usefulness and ease of use on the sustained use intention. Research design, data and methodology: Residents in Suwon, Gyeonggi-do, selected as candidate local governments for the Smart City Challenge Project of the Ministry of Land, Infrastructure and Transport in June 2019 to measure the perceived technology acceptance of potential users for the AI technology for the elderly living alone as part of the smart city technology. In order to evaluate the intention of using AI speaker, which is the target system of this study, a video of a chatbot using experience of elderly people living alone was produced. Results: First of all, in order for the elderly living alone to have an attitude to use AI-based speakers, there should be a perceived usefulness of the quality of life of the elderly. However, ease of use did not show any significant causal relationship to attitude toward use. In addition, the attitude toward use weakly influenced the intention to use. In other words, elderly people living alone were not likely to have a significant effect on their attitude toward use. However, feeling that AI speakers are easy to use will help to improve the quality of life, which in turn led to the attitude toward using AI speakers, which could lead to indirect effects. Finally, the perceived usefulness of quality of life was found to have a weak effect on direct use intentions. Conclusions: This study conducted a study on the technology acceptance of service environment to improve the quality of life for the specific user group who live alone in the smart seat environment. In this study, we examined the effects of AI speaker on the elderly living alone to improve the quality of life for the elderly living alone.

철강산업 트렌드 분석을 위한 텍스트 마이닝 도입 연구 : P사(社) 사례를 중심으로 (A Pilot Study on Applying Text Mining Tools to Analyzing Steel Industry Trends : A Case Study of the Steel Industry for the Company "P")

  • 민기영;김훈태;지용구
    • 한국전자거래학회지
    • /
    • 제19권3호
    • /
    • pp.51-64
    • /
    • 2014
  • 기업은 생존을 위해 수많은 정보 속에서 빠르게 상황을 인식하고 미래를 예측하기 위해 정량데이터 분석뿐만 아니라 비정형데이터 분석에 대한 관심이 높아지고 있으나, 철강산업에서는 아직 활발하게 활용되지는 못하고 있다. 이에 본 연구에서는 글로벌 철강회사인 P사(社)의 사례를 중심으로 텍스트 마이닝을 이용한 산업트렌드 분석을 시도해 경쟁사 전략, 관심국가의 시장변화, 해외사업장 여론 등을 파악 하는데 기여할 수 있다는 가능성을 발견하였다. 사례 분석은 철강산업을 10개의 카테고리로 분류하고 각각 10개의 주제를 선정하여 분석을 시도하고, 이중 의미 있는 변화를 발견하면 심층 분석하는 형태로 진행하였다. 이번 P사(社)의 사례를 통해 텍스트 마이닝을 통한 산업트렌드 분석이 더 의미 있기 위해서는 목적을 명확히 하고, 관련 키워드를 체계화한다면 경쟁사 전략 파악, 리스크관리, 정량데이터 예측 보정 등 많은 부분에 기여할 수 있을 것으로 기대한다.

중점관리기준에 기초한 국내생산 당귀의 산지 수확 후 아플라톡신의 안전성 평가 연구 (Safety Evaluation from Aflatoxin risk of Korean Angelicae Gigantis Radix Based on Critical Control Points)

  • 최혜진;안태진;안영섭;박충범;김주일;박성환;양현;도기헌;문유석
    • 한국약용작물학회지
    • /
    • 제19권1호
    • /
    • pp.47-53
    • /
    • 2011
  • HACCP methodology was applied in the post-harvest processing and storage of domestic medicinal produces. Particularly in terms of mold and mycotoxin contamination, candidate critical control points (CCP) in the conventional practice in Korean farms were selected and monitored by comparing with on the standard guided processing and storage. When each processing of Angelicae Gigantis Radix were assessed for their safety, the drying steps such as the sun drying or the thermal drying depending on each farm made differences in mold contamination. Moreover, the storage conditions before or after the processing were another critical determinant in the fungal contamination. In other words, storage under $4{\circ}C$ rather than at room temperature was favorable for reducing mold growth in the harvested crops. Occurrence rate of Aflatoxin $B_1 \;(AFB_1)$ in Angelicae Gigantis Radix were 12.8%, but amount of $AFB_1$ in all the collected samples were below 10 ppb regulatory limit allowed in Korea. However, for a few samples of Angelicae Gigantis Radix, still relatively high levels of total amount of the major aflatoxins (aflatoxin $B_1\; +\; B_2\; +\; G_1\; +\; G_2$) were observed around 0.18~49.94 ppb, which is not regulated presently in Korea. It thus can be suggested that post-harvest processing and storage of Korean medicinal crops need further investigation and monitoring to establish the Good Agricultural Practice (GAP), particularly to minimize microbial risk including mold and mycotoxin contamination under the changing climate. Additionally, it is also warranted for new enacting of regulatory limits for total aflatoxins in the medicinal crops.

문장추상화 : 개념추상화를 도입한 문장교열 (Sentence ion : Sentence Revision with Concept ion)

  • 김곤;양재곤;배재학;이종혁
    • 정보처리학회논문지B
    • /
    • 제11B권5호
    • /
    • pp.563-572
    • /
    • 2004
  • 문장추상화(Sentence Abstraction)는 문장의 의사전달 기능이 보존된 단순화이다. 이는 문장교열(Sentence Revision)과 개념추상화(Concept Abstraction)를 동시에 가능하게 한다. 문장교열은 사람이 생각한 바와 문장으로 표현된 의미의 차이를 해결하는 방법이다. 개념추상화는 개념들의 공통된 요소로부터 얻은 보편적인 관념을 표현하는 것이다. 문장추상화는 문장의 주요구성성분들을 선별해 내고, 이들의 의미적인 정보를 파악하여 상위개념을 표현함으로써 문장교열과 개념추상화를 가능하게 한다. 본 논문에서는 문장추상화를 위한 구문분석기 LGPI+와, 온톨러지 OfN을 구체화하였다. 문장추상기 SABOT는 LGPI+와 OfN을 활용하며, 구문분석 결과를 처리하여 문장에서 추상화 할 후보난어를 선택한다. 문장추상화를 활용한 원문이해 시스템으로 23개 이야기의 58개 문단에 대해 중요 문장에 대한 문장재현율과 선별된 문장들의 주제관련성을 확인해 보았다. 실험결과, 문장재현율은 54~72%의 범위이었고, 주제관련성은 76~86% 정도의 비율로 나타났다. 이를 유사 시스템과 비교해 보았을 때, 약 10~20% 정도의 성능향상을 보인다. 본 논문에서는 문장추상화를 활용하여 글의 화제문을 효율적으로 선택할 수 있는 문장교열과 원문의 이해심도를 보다 더 깊게 할 수 있는 개념추상화가 가능함을 확인하였다.

조류제거 효과에 대한 Top-down 어류 조작실험 (Top-down Fish Biomanipulation Experiments on Algal Removal Effects)

  • 이상재;이재연;안광국
    • 생태와환경
    • /
    • 제40권3호
    • /
    • pp.431-438
    • /
    • 2007
  • 본 연구는 Top-down 어류조작 실험에 의한 조류제거 효과를 평가하는 것으로써, 실험대상 어종으로 국내 농업용 저수지에 우점하는 8종의 어류를 선정하였다. 대조군 수조 및 어류처리군 수조($3{\sim}6$개체)의 엽록소-${\alpha}$ (CHL-${\alpha}$) 초기 농도는 $100{\sim}120{\mu}g\;L^{-1}$로 고정하였으며 용존산소 $5.3{\sim}8.2\;mg\;L^{-1}$, 수소 이온농도는 pH $7.4{\sim}8.1$를 유지시켰다. 실험기간 동안 어류 처리군 수조의 용존산소량과 수소이온농도가 대조군에 비해 낮게 측정된 반면 전기전도도는 점진적으로 증가하는 수치를 보였다. 한편 대조군과 어류처리군의 CHL-${\alpha}$는 각각 13%, 6%로 증가하여 여전히 조류의 생장이 이루어지고 있음을 보였으나, 어류처리 군에서 CHL-${\alpha}$ 증가율은 대조군에서 보다 낮게 나타났다. 대조군과 어류처리군의 남조류는 각각 32%, 20% 감소를 보였으며, 남조류 생장률은 대조군보다 어류처리군에서 크게 나타났다. 이는 어류 배설물에 의한 영양염류의 증가로 인한 것으로 사료되었다. 따라서 본 연구결과 어류조작에 의한 조류제거 효과는 거의 없는 것으로 나타났다.

랜드마크 코너 추출을 적용한 모바일 카메라 기반 위치결정 기법 (Mobile Camera-Based Positioning Method by Applying Landmark Corner Extraction)

  • 이유진;윤완상;이수암
    • 대한원격탐사학회지
    • /
    • 제39권6_1호
    • /
    • pp.1309-1320
    • /
    • 2023
  • 모바일 기기의 기술 발전과 대중화는 어디서든 사용자의 위치를 확인할 수 있으며 인터넷을 사용할 수 있도록 발전되었다. 그러나 실내의 경우 인터넷은 끊김없이 사용할 수 있지만 global positioning system (GPS) 기능은 활용하기 어렵다. 실내 공공장소인 백화점, 박물관, 컨퍼런스장, 학교, 터널 등 GPS가 수신되지 않는 음영 지역에서 실시간 위치정보 제공의 필요성이 증가하고 있다. 이에 따라 최근의 실내 측위 기술은 랜드마크 데이터베이스를 구축하기 위해 light detection and ranging (LiDAR) 장비를 기반으로 연구가 증가하고 있다. 본 연구에서는 랜드마크 데이터베이스 구축의 접근성에 초점을 두어 모바일 기기를 기반으로 랜드마크를 촬영한 단일 이미지와 사전에 구축된 랜드마크 데이터베이스 정보를 이용하여 사용자의 위치를 추정하는 기법을 개발하고자 하였다. 첫 번째로, 랜드마크 데이터베이스를 구축하였다. 랜드마크를 촬영한 모바일 이미지만으로 사용자 위치를 추정하기 위해서는 모바일 이미지에서 랜드마크 검출이 필수적이고, 검출된 랜드마크에서 고정적인 성격을 가진 지점의 지상좌표 취득이 필수적이다. 두 번째 단계에서는 bag of words (BoW) 영상 검색 기술을 적용해 랜드마크 데이터베이스 중 모바일 이미지가 촬영한 랜드마크를 유사한 4위까지 검색하였다. 세 번째 단계에서는 scale invariant feature transform (SIFT) 특징점 추출 기법과 Homography random sample consensus (RANSAC)을 통해 검색된 4개의 후보 랜드마크들 중 가장 유사한 하나의 랜드마크를 선정하였고, 이때 임계값 설정을 통해 정합점 수를 기반으로 한 차례 더 필터링을 수행하였다. 네 번째 단계에서는 대응된 랜드마크와 모바일 이미지간의 Homography 행렬을 통해 랜드마크 이미지를 모바일 이미지에 투사하여 랜드마크의 영역과 코너(외곽선)점을 검출하였다. 마지막으로, 위치추정 기법을 통해 사용자의 위치를 추정하였다. 해당 기술의 성능을 분석한 결과, 랜드마크 검색 성능은 약 86%로 측정되었다. 위치추정 결과와 사용자의 실제 지상좌표를 비교한 결과, 약 0.56 m의 수평 위치 정확도를 갖는 것이 확인되어 별도의 고가 장비 없이 랜드마크 데이터베이스를 구축하여 모바일 영상으로 사용자 위치 추정이 가능한 것을 확인하였다.

키워드 자동 생성에 대한 새로운 접근법: 역 벡터공간모델을 이용한 키워드 할당 방법 (A New Approach to Automatic Keyword Generation Using Inverse Vector Space Model)

  • 조원진;노상규;윤지영;박진수
    • Asia pacific journal of information systems
    • /
    • 제21권1호
    • /
    • pp.103-122
    • /
    • 2011
  • Recently, numerous documents have been made available electronically. Internet search engines and digital libraries commonly return query results containing hundreds or even thousands of documents. In this situation, it is virtually impossible for users to examine complete documents to determine whether they might be useful for them. For this reason, some on-line documents are accompanied by a list of keywords specified by the authors in an effort to guide the users by facilitating the filtering process. In this way, a set of keywords is often considered a condensed version of the whole document and therefore plays an important role for document retrieval, Web page retrieval, document clustering, summarization, text mining, and so on. Since many academic journals ask the authors to provide a list of five or six keywords on the first page of an article, keywords are most familiar in the context of journal articles. However, many other types of documents could not benefit from the use of keywords, including Web pages, email messages, news reports, magazine articles, and business papers. Although the potential benefit is large, the implementation itself is the obstacle; manually assigning keywords to all documents is a daunting task, or even impractical in that it is extremely tedious and time-consuming requiring a certain level of domain knowledge. Therefore, it is highly desirable to automate the keyword generation process. There are mainly two approaches to achieving this aim: keyword assignment approach and keyword extraction approach. Both approaches use machine learning methods and require, for training purposes, a set of documents with keywords already attached. In the former approach, there is a given set of vocabulary, and the aim is to match them to the texts. In other words, the keywords assignment approach seeks to select the words from a controlled vocabulary that best describes a document. Although this approach is domain dependent and is not easy to transfer and expand, it can generate implicit keywords that do not appear in a document. On the other hand, in the latter approach, the aim is to extract keywords with respect to their relevance in the text without prior vocabulary. In this approach, automatic keyword generation is treated as a classification task, and keywords are commonly extracted based on supervised learning techniques. Thus, keyword extraction algorithms classify candidate keywords in a document into positive or negative examples. Several systems such as Extractor and Kea were developed using keyword extraction approach. Most indicative words in a document are selected as keywords for that document and as a result, keywords extraction is limited to terms that appear in the document. Therefore, keywords extraction cannot generate implicit keywords that are not included in a document. According to the experiment results of Turney, about 64% to 90% of keywords assigned by the authors can be found in the full text of an article. Inversely, it also means that 10% to 36% of the keywords assigned by the authors do not appear in the article, which cannot be generated through keyword extraction algorithms. Our preliminary experiment result also shows that 37% of keywords assigned by the authors are not included in the full text. This is the reason why we have decided to adopt the keyword assignment approach. In this paper, we propose a new approach for automatic keyword assignment namely IVSM(Inverse Vector Space Model). The model is based on a vector space model. which is a conventional information retrieval model that represents documents and queries by vectors in a multidimensional space. IVSM generates an appropriate keyword set for a specific document by measuring the distance between the document and the keyword sets. The keyword assignment process of IVSM is as follows: (1) calculating the vector length of each keyword set based on each keyword weight; (2) preprocessing and parsing a target document that does not have keywords; (3) calculating the vector length of the target document based on the term frequency; (4) measuring the cosine similarity between each keyword set and the target document; and (5) generating keywords that have high similarity scores. Two keyword generation systems were implemented applying IVSM: IVSM system for Web-based community service and stand-alone IVSM system. Firstly, the IVSM system is implemented in a community service for sharing knowledge and opinions on current trends such as fashion, movies, social problems, and health information. The stand-alone IVSM system is dedicated to generating keywords for academic papers, and, indeed, it has been tested through a number of academic papers including those published by the Korean Association of Shipping and Logistics, the Korea Research Academy of Distribution Information, the Korea Logistics Society, the Korea Logistics Research Association, and the Korea Port Economic Association. We measured the performance of IVSM by the number of matches between the IVSM-generated keywords and the author-assigned keywords. According to our experiment, the precisions of IVSM applied to Web-based community service and academic journals were 0.75 and 0.71, respectively. The performance of both systems is much better than that of baseline systems that generate keywords based on simple probability. Also, IVSM shows comparable performance to Extractor that is a representative system of keyword extraction approach developed by Turney. As electronic documents increase, we expect that IVSM proposed in this paper can be applied to many electronic documents in Web-based community and digital library.

Structural SVM을 이용한 백과사전 문서 내 생략 문장성분 복원 (Restoring Omitted Sentence Constituents in Encyclopedia Documents Using Structural SVM)

  • 황민국;김영태;나동열;임수종;김현기
    • 지능정보연구
    • /
    • 제21권2호
    • /
    • pp.131-150
    • /
    • 2015
  • 영어와 달리 한국어나 일본어 문장의 경우 용언의 필수격을 채우는 명사구가 생략되는 무형대용어 현상이 빈번하다. 특히 백과사전이나 위키피디아의 문서에서 표제어로 채울 수 있는 격의 경우 그 격이 문장에서 더 쉽게 생략된다. 정보검색, 질의응답 시스템 등 주요 지능형 응용시스템들은 백과사전류의 문서에서 주요한 정보를 추출하여 수집하여야 한다. 그러나 이러한 명사구 생략 현상으로 인해 양질의 정보추출이 어렵다. 본 논문에서는 백과사전 종류 문서에서 생략된 명사구 즉 무형대용어를 복원하는 시스템의 개발을 다루었다. 우리 시스템이 다루는 문제는 자연어처리의 무형대용어 해결 문제와 거의 유사하나, 우리 문제의 경우 문서의 일부가 아닌 표제어도 복원에 이용할 수 있다는 점이 다르다. 무형대용어 복원을 위해서는 먼저 무형대용어의 탐지 즉 문서 내에서 명사구 생략이 일어난 곳을 찾는 작업을 수행한다. 그 다음 무형대용어의 선행어 탐색 즉 무형대용어의 복원에 사용될 명사구를 문서 내에서 찾는 작업을 수행한다. 문서 내에서 선행어를 발견하지 못하면 표제어를 이용한 복원을 시도해 본다. 우리 방법의 특징은 복원에 사용된 문장성분을 찾기 위해 Structural SVM을 사용하는 것이다. 문서 내에서 생략이 일어난 위치보다 앞에 나온 명사구들에 대해 Structural SVM에 의한 시퀀스 레이블링(sequence labeling) 작업을 시행하여 복원에 이용 가능한 명사구인 선행어를 찾아내어 이를 이용하여 복원 작업을 수행한다. 우리 시스템의 성능은 F1 = 68.58로 측정되었으며 이는 의미정보의 이용 없이 달성한 점을 감안하면 높은 수준으로 평가된다.

한우에서 모색관련 유전자 변이에 관한 연구 (Investigation of Coat Color Candidate Genes in Korean Cattle(Hanwoo))

  • 도경탁;신희영;이종혁;김내수;박응우;윤두학;김관석
    • Journal of Animal Science and Technology
    • /
    • 제49권6호
    • /
    • pp.711-718
    • /
    • 2007
  • 본 연구는 한우의 모색발현에 정확히 어떤 유전자가 어떤 유전기작에 의해 관여하고 있는가를 규명하고자 황갈색의 모색을 지닌 한우와 검정모색을 지닌 홀스타인과의 교배를 통해 만든 F2집단의 DNA를 이용하여, MC1R, ASIP 및 TYRP1 유전자형과 한우모색 발현양상을 연관분석 하였으며, 또 한우 집단내에서의 이들 유전자형 빈도를 조사하여 황갈색 한우모색 다양성과 후보유전자 변이의 연관성연구에 필요한 정보를 제공하고자 하였다. MC1R 유전자의 경우 황갈색을 지닌 3두의 유전자형은 모두 e/e 형으로 밝혀졌으며, 검정모색을 지니고 태어난 나머지 3두의 두 좌위에서의 유전자형은 ED/e임을 확인하였는데 황갈색과 검정모색의 비율이 1:1로 나온다는 것은 MC1R 단일유전자가 한우의 모색에 중요한 영향을 미치는 것으로 사료된다. MC1R 이외의 모색발현에 영향을 줄 수 있는 ASIP와 TYRP1 유전자들은 F2 집단에서 염기서열을 분석한 결과 이들 유전자들이 한우 황갈색모색에 주된 영향을 미치지 않는 것으로 나타났다. 하지만 TYRP1 유전자에서 발견된 329번 (Glu329Lys) 아미노산 변이는 TYRP1 단백질의 구조와 화학적 성질에 영향을 줄 수 있는 것으로 사료되어 한우집단에서 황갈색바탕의 모색변이에 영향을 줄 수 있는지에 대한 추가적인 연구가 이루어져야 할 것이다.