• 제목/요약/키워드: Data dictionary

검색결과 347건 처리시간 0.03초

한의학술논문 데이터베이스 구축을 위한 입력 및 검수 시스템 개발 (The Implementation of Database Building System for Korean Medical Paper Database)

  • 예상준;김익태;장윤지;성보석;장현철;김상균;김안나;송미영;김철
    • 한국한의학연구원논문집
    • /
    • 제18권3호
    • /
    • pp.141-146
    • /
    • 2012
  • Objectives : KIOM(Korean Institute of Oriental Medicine) built up korean medical paper database and services it through information portal OASIS. The database are updated about 1,600 papers and 48,000 references annually. Because lots of manpower and time are needed to update database, it is very important to raise up efficiency and quality of it. Methods : In this paper, we implemented web based database building system utilizing pre-built OASIS' database to improve the working process, data quality and ease of management. Results : First we designed and implemented web based system to input bibliography of the paper efficiently. It raised efficiency using OASIS' paper and reference database. Second we improved the refining process using web based system to raise up data quality. And third we developed the manager functions of web based system to control and check the working process. Conclusions : If we add korean medical dictionary and link outside paper database in the future, we hope that work efficiency and data quality will be raised more. And because the database schema of OASIS system and developed system are different, we are implementing the data transformation system.

수화 표현을 위한 손 모양 편집 프로그램의 개발 (Development of a Hand Shape Editor for Sign Language Expression)

  • 오영준;박광현;변증남
    • 전자공학회논문지SC
    • /
    • 제44권4호통권316호
    • /
    • pp.48-54
    • /
    • 2007
  • 손 모양은 청각장애인의 의사소통 수단인 수화에서 중용한 요소 중 하나이다. OpenGL 기반의 가상현실 공간에서 수화 동작을 표현하기 위해서는 수화 동작 데이터를 삽입하고 수정하는 편집 프로그램이 필요하다. 하지만, 기준의 수화 동작 편집기는 수화를 잘 이해하지 못하는 일반 사용자가 손 모양을 정확하게 편집하거나 표현하는데 어려움이 있다. 또한, 수화 사전에 포함되는 각 수화 단어의 데이터 수가 많기 때문에 이를 효율적으로 생성하고 저장하는 프로그램이 필요하다. 본 논문에서는 그래픽 사용자 인터페이스(GUI)를 통해 다양한 손 모양을 쉽게 편집하고 생성된 손 모양 데이터를 데이터베이스에 저장할 수 있는 손 모양 편집 프로그램을 개발하였다. 생성된 손 모양 코드는 수화 동작을 생성하기 위한 수화 단어 편집기에 연결되어 수화 데이터베이스의 전체 용량을 감소시킨다.

입원환자의 낙상발생 연구 자료원으로서의 국제간호실무분류체계 기반 전자간호기록의 유용성 (Exploring the Utility of the ICNP based Electronic Nursing Records as a Research Source for Inpatients' Falls)

  • 조인숙;박인숙;김은만
    • Perspectives in Nursing Science
    • /
    • 제5권1호
    • /
    • pp.33-43
    • /
    • 2008
  • Objective: This study explored the reuse of data captured into an electronic nursing record system using the International Classification for Nursing Practice to support nursing research of inpatient's falls. Methods: Risk factors relevant to inpatients falls ;n an acute setting were identified from the literature review. Four risk assessment tools and two risk identification studies were selected. To examine the availability of coded data in an electronic nursing record system for the identified fall fisk factors, we reviewed 11.319 hospital-day records of 118 patients who were reported by the self-report system. Results: We identified 24 fall risk factors of five categories from the literature review, which were used to identify the standard nursing statements addressing fall risks. One hundred thirty five nursing statements were searched from the hospital's nursing data dictionary of statements and were matched with 14 fall fisk factors. Using the 135 statements. we found that mental status, catheter of drip in situ, abnormal gait, insomnia, surgical procedure. and dizziness/vertigo appeared frequently in the nursing records of inpatients with fall s. Also we found 6 risk factors more through the record review. Conclusion: The electronic records would be a good research source for inpatients' falls. Specifically international classification for nursing practice based nursing record system has the potential for promoting clinical researches.

  • PDF

교수-학습지원시스템에서 학습자 질의응답 자동분류를 위한 토픽 모델링 (Topic modeling for automatic classification of learner question and answer in teaching-learning support system)

  • 김경록;송혜진;문남미
    • 디지털콘텐츠학회 논문지
    • /
    • 제18권2호
    • /
    • pp.339-346
    • /
    • 2017
  • 기사와 댓글, 질의응답과 같은 비정형 데이터에 기반한 텍스트 분석에 대한 관심이 증가하고 있다. 이는 사람들의 견해인 비정형 텍스트 데이터로부터 특징을 파악하고, 평가, 예측 및 추천에 활용할 수 있기 때문이다. TEL 분야에서도 MOOC 서비스의 확대로 교수학습지원시스템 기반 토론, 질의응답 서비스를 자동화하기 위한 관심이 증가하고 있다. 시스템에 축적된 질의응답 데이터를 기반으로 질의 토픽을 생성하고, 새로운 질의에 대해 토픽을 자동분류하기 위해서이다. 따라서 본 연구에서는 새로운 질의 토픽을 자동분류 할 수 있도록 LDA기법을 활용한 토픽 모델링을 제안하고자 한다. 이를 바탕으로 질의 토픽 사전을 생성하고 새로운 질의에 대해 토픽을 자동분류 할 수 있다. 일부 질의에서는 0.7 이상의 높은 자동 분류를 보였으며, 새로운 질의가 여러 토픽에 포함될수록 좀 더 좋은 자동분류 결과를 보였다.

대규모 범죄 수사기록을 활용한 온톨로지 기반 서비스 구현 - 침입 절도 범죄 분야를 중심으로 - (Implementation of Ontology-based Service by Exploiting Massive Crime Investigation Records: Focusing on Intrusion Theft)

  • 고건우;김선우;박성진;노윤주;최성필
    • 한국문헌정보학회지
    • /
    • 제53권1호
    • /
    • pp.57-81
    • /
    • 2019
  • 온톨로지는 특정 분야의 특정 지식과 관련된 용어 및 용어 사이의 관계를 정의하는 복합 구조 사전이다. 국내외로 다양한 온톨로지 구축의 시도가 있었으나 대규모의 범죄 수사기록을 온톨로지로 구축하고 이를 통한 서비스를 구현한 사례는 존재하지 않았다. 따라서 본 논문은 비정형 데이터인 범죄 수사기록 문서 중 침입 절도 분야로부터 추출한 정보를 통해 온톨로지를 구축하고, 온톨로지 기반의 검색 서비스와 범행 장소 추천 서비스를 구현하는 과정을 설명한다. 검색 서비스의 성능을 파악하기 위하여 사건 검색에 대한 정확도 측정 방법 중 하나인 Top-K 방식의 정확도 측정을 실험하였고, 실험 집합에 대하여 최대 93.52%의 정확도를 얻었다. 또한, 범행 장소 추천 서비스의 성능을 파악하기 위한 실험 결과, 실험 데이터셋의 전체에 대해 적합한 단서 필드 조합을 얻어냈으며, F1-measure 76.19%의 성능으로 데이터베이스 내의 범행 장소 필드 정보를 교정할 수 있음을 확인하였다.

Interactive Morphological Analysis to Improve Accuracy of Keyword Extraction Based on Cohesion Scoring

  • Yu, Yang Woo;Kim, Hyeon Gyu
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권12호
    • /
    • pp.145-153
    • /
    • 2020
  • 최근 소셜 빅데이터를 대상으로 한 키워드 분석은 고객 관점의 의견이나 불만 사항을 추출하기 위한 목적으로 광범위하게 활용되고 있다. 이와 관련하여, 이전 연구에서는 키워드 분석의 정확도를 높이기 위해 응집도 점수를 활용한 방법을 제안하였으나, 리뷰의 수가 적을 경우 오류율이 증가하는 문제가 있었다. 본 논문에서는 응집도 점수 기반 알고리즘으로부터 추출된 키워드에 대해 간소화된 형태소 분석 단계를 후처리 형태로 적용함으로써 키워드 추출의 정확도를 개선하고자 하였다. 제안 방법은 입력 데이터가 주어질 때마다 필요한 형태소 분석 규칙을 점증적으로 추가할 수 있도록 지원함으로써, 사전의 크기를 최소화하고 분석의 효율을 높이고자 하였다. 또한 대화형 규칙 입력 시스템을 제공하여 분석 규칙 추가에 드는 노력을 최소화하고자 하였다. 제안 방법을 검증하기 위해 온라인에서 수집된 실제 리뷰를 대상으로 실험을 수행하였으며, 제안 방법을 적용할 경우 오류율이 기존 10%에서 1%로 개선되는 동시에, 5,000개의 리뷰 처리에 450ms가 소요되어 실시간 처리가 가능한 수준임을 확인하였다.

영상의 효과음을 통한 분위기 메타데이터 추출 (Extractiong mood metadata through sound effects of video)

  • 유연휘;박효경;용성중;이서영;문일영
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 춘계학술대회
    • /
    • pp.453-455
    • /
    • 2022
  • 메타데이터는 데이터에 대한 속성이나 특징을 설명하는 구조화된 데이터를 말한다. 그중에서 비디오 메타데이터는 정확한 콘텐츠 기반 검색을 위해 비디오를 구성하는 정보에서 추출한 데이터를 의미한다. 최근 영상 콘텐츠를 이용하는 사용자들이 늘어나면서 자연스럽게 OTT 제공 업체들 역시 늘어나고 있으며, OTT 제공 업체에서 많은 양의 영상 콘텐츠를 개인 사용자에게 추천 또는 알맞은 검색을 위해 메타데이터의 역할이 중요해지고 있다. 본 논문에서는 영상의 효과음을 통해 분위기 속성에 대한 메타데이터를 자동으로 추출하는 방법에 관해 연구를 진행하였다. 영상의 효과음에 대한 분류와 분위기 속성에 대한 메타데이터 생성을 위해 분위기에 대한 용어사전을 구축하고 지도학습을 통해 정보를 추출하는 방법을 제안하고자 한다.

  • PDF

유통되고 있는 실내조경 식물명과 학명과의 차이 (Differences Between Common Name and Scientific Name of Interior Landscape Plants in Practical Circulation)

  • 방광자;최경옥;이태영
    • 한국조경학회지
    • /
    • 제28권6호
    • /
    • pp.127-132
    • /
    • 2001
  • The purpose of this research is to compare and analyze scientific names and Korean names of interior plants, considering that consumes' purchasing systems consist of internet and communication media in the era of informationalization, to help the consumers purchasing plants, and to propose some directions for the unification of Korean name in practical circulation. This survey was performed during 4 months from May to September in 2000. The survey places for research were wholesale flower market of YangJje Dong and Nam Seoul. The used plants for research were 37 family, 76 genus and 120 species. The main methods of data collection were interview and reference f plants picture books. The main reference for identifying plant name was accomplished by Yoon Ypung-Sub's HORTUS KOREANA. The research results are as follows; 1) Fifty one plants were identified as using generic or specific name. 2) Thirteen plants were identified as using varietal name. 3) Twenty four plants were identified as using common name recoded in a plant dictionary. 4)Thirteen plants were identified as using incorrect name. Consequently, it was identified that the research for the unification of Korean name of interior landscape plants should be performed thorough continuous cooperation between academic field and business field for solving various problems which is occurred in plants circulation process.

  • PDF

띄어쓰기 및 철자 오류 동시교정을 위한 통계적 모델 (A Joint Statistical Model for Word Spacing and Spelling Error Correction Simultaneously)

  • 노형종;차정원;이근배
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제34권2호
    • /
    • pp.131-139
    • /
    • 2007
  • 본 논문에서는 띄어쓰기 오류와 철자 오류를 동시에 교정 가능한 전처리기를 제안한다. 제시된 알고리즘은 기존의 전처리기 알고리즘이 각 오류를 따로 해결하는 데에서 오는 한계를 극복하고, 기존의 noisy-channel model을 확장하여 대화체의 띄어쓰기 오류와 철자 오류를 동시에 효과적으로 교정할 수 있다. N-gram과 자소변환확률 등의 통계적 방법과 어절변환패턴 사전을 이용하여 최대한 사전을 적게 이용하면서도 효과적으로 교정 후보들을 생성할 수 있다. 실험을 통해 현재 단계에서는 만족할 만한 성능을 얻지는 못하였지만 오류 분석을 통하여 이와 같은 방법론이 실제로 효용성이 있음을 알 수 있었고 앞으로 더 많은 개선을 통해 일상적인 대화체 문장에 대해서 효과적인 전처리기로서 기능할 수 있을 것으로 기대된다.

Word2Vec 학습을 통한 의미 기반 해외 유사 특허 검색 방안 (Identifying Similar Overseas Patent Using Word2Vec-Based Semantic Text Analytics)

  • 백민지;김남규
    • 한국IT서비스학회지
    • /
    • 제17권2호
    • /
    • pp.129-142
    • /
    • 2018
  • Recently, the number of patent applications have been increasing rapidly every year as the importance of protecting intellectual property rights becomes more important. Patents must be inventive and have novelty. Especially, the novelty implies that the corresponding invention is not the same as the previous invention. To confirm the novelty, prior art search must be conducted before and after the application. The target of prior art search should include not only Korean patents but also foreign patents. Search of foreign patents should be supported by multilingual search techniques. However, a dictionary-based naive approach shows a limitation because some technical concepts are represented in different terms according to each nation. For example, a Korean term and a Japanese term may not be synonym even though they represent the same technical concept. In this paper, we propose a new method to map semantic similarity between technical terms in Korean patents and Japanese patents. To investigate different representations in each nation for the same technical concept, we identified and analyzed pairs of patents those are mutually connected with priority claim relationship. By performing an experiment with real-world data, we showed that our approach can reveal semantically similar technical terms in other language successfully.