• Title/Summary/Keyword: 언어자원 구축

Search Result 136, Processing Time 0.03 seconds

Video Search System using Semantic Web and MPEG-7 Metadata (시맨틱 웹과 MPEG-7 메타데이타를 이용한 비디오 검색 시스템)

  • Lee Seong-Woo;Han Jong-Hyeong;Ahn Chul-Bum;Nah Yun-Mook
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2006.05a
    • /
    • pp.165-168
    • /
    • 2006
  • 본 논문에서는 시맨틱 웹을 위한 마크업 언어인 RDF와 MPEG-7 표준을 따르는 XML 문서를 이용하여 구축된 비디오 검색 시스템에 대한 연구결과를 기술한다. 본 논문에서 제안된 시스템은 RDF를 통해 비디오 파일에 대한 정보를 웹 자원의 관점으로 정의/저장한다. 또한 비디오에 대한 내용기반 검색을 위해 비디오를 구성하는 중요 프레임들을 추출하여 그림 파일로 저장하는 한편 각 프레임에 대한 정보를 MPEG-7 표준에 따라 XML 형태로 저장한다. 이렇게 구축된 정보들을 바탕으로 비디오 검색 엔진은 사용자의 질의요청을 수행한다. 본 논문에서 제안하는 비디오 검색 시스템은 비디오에 대한 다양한 검색은 물론 비디오에 대한 내용기반 검색이 가능한 장점을 가진다.

  • PDF

OWL Authoring System for building Web Ontology (웹 온톨로지 구축을 위한 OWL 저작 시스템)

  • Lee Moohun;Cho Hyunkyu;Cho Hyeonsung;Cho Sunghoon;Jang Changbok;Choi Euiin
    • The Journal of Society for e-Business Studies
    • /
    • v.10 no.3
    • /
    • pp.21-36
    • /
    • 2005
  • Current web search includes a lot of different results with information that user does not want, because it searches information using keyword mapping. Ontology can describe the correct meaning of web resource and relationships between web resources. And we can extract suitable information that user wants using Ontology Accordingly, we need the ontology to represent knowledge. W3C announced OWL(Web Ontology Language), meaning description technology for such web resource. However, the development of a special tool that can effectively compose and edit OWL is inactive. In this paper, we designed and developed an OWL authoring system that can effectively provide the generation and edit about OWL.

  • PDF

A Study on VoiceXML Application of User-Controlled Form Dialog System (사용자 주도 폼 다이얼로그 시스템의 VoiceXML 어플리케이션에 관한 연구)

  • Kwon, Hyeong-Joon;Roh, Yong-Wan;Lee, Hyon-Gu;Hong, Hwang-Seok
    • The KIPS Transactions:PartB
    • /
    • v.14B no.3 s.113
    • /
    • pp.183-190
    • /
    • 2007
  • VoiceXML is new markup language which is designed for web resource navigation via voice based on XML. An application using VoiceXML is classified into mutual-controlled and machine-controlled form dialog structure. Such dialog structures can't construct service which provide free navigation of web resource by user because a scenario is decided by application developer. In this paper, we propose VoiceXML application structure using user-controlled form dialog system which decide service scenario according to user's intention. The proposed application automatically detects recognition candidates from requested information by user, and then system uses recognition candidate as voice-anchor. Also, system connects each voice-anchor with new voice-node. An example of proposed system, we implement news service with IT term dictionary, and we confirm detection and registration of voice-anchor and make an estimate of hit rate about measurement of an successive offer from information according to user's intention and response speed. As the experiment result, we confirmed possibility which is more freely navigation of web resource than existing VoiceXML form dialog systems.

A Measure of Semantic Similarity and its Application in User-Word Intelligent Network (U-WIN을 이용한 의미 유사도 측정과 활용)

  • Im, Ji-Hui;Bae, Young-Jun;Choe, Ho-Seop;Ock, Cheol-Young
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2007.06c
    • /
    • pp.189-193
    • /
    • 2007
  • 개념 간의 유사도 측정 방법은 의미망에서의 두 개념의 최단 경로의 수 노드의 깊이 관계의 종류 등의 정보를 이용하는 링크(Link) 기반 방법, 대용량의 말뭉치에서의 개념의 발생빈도를 확률로 계산한 정보량(Information Content) 기반 방법, 관련 단어들의 공기정보를 활용한 의미(Gloss) 기반 방법이 있으며, 이미 국외에서는 WordNet과 같은 의미적 언어자원을 활용하여 많은 연구가 진행되고 있다. 그러나 국내에서는 아직 한국어 의미망을 바탕으로 한 개념간의 유사성 측정 방법이나 이를 활용하는 방법에 대한 연구가 미흡하다. 본 논문에서는 이를 바탕으로 링크 타입 노드의 깊이 최단경로 정보량 등의 요소를 이용한 의미 유사도 측정방법을 제안하고 이를 활용하여 명사-용언간의 연계 정보를 확보함으로써, 효율적으로 명사-용언간의 네트워크를 구축하도록 한다.

  • PDF

Generation Paraphrase using Pointer Generation Network (포인터 생성 네트워크를 이용한 패러프레이즈 생성)

  • Park, Da-Sol;Kim, Young-kil;Cha, Jeong-Won
    • Annual Conference on Human and Language Technology
    • /
    • 2020.10a
    • /
    • pp.535-539
    • /
    • 2020
  • 다양한 발화를 모델링하는 요구는 자연어 처리 분야에서 꾸준히 있었으며 단어, 구 또는 문장과 동등한 의미 콘텐츠를 자동으로 식별하고 생성하는 것은 자연어 처리의 중요한 부분이다. 본 논문에서는 포인터 생성 네트워크(Pointer Generate Nework)를 이용하여 패러프레이즈 생성 모델을 제안한다. 제안한 모델의 성능을 측정하기 위해 사람이 직접 구축한 유사 문장 코퍼스를 이용하였으며, 토큰 단위의 BLEU-4 0.250, ROUGE_L 0.455, CIDEr 2.190의 성능을 보였다. 하지만 입력 문장과 동일한 문장을 출력하는 문제점이 존재하여 빔서치(beam search)를 적용하여 입력 문장과 비교하여 생성 문장을 선택하는 방식을 적용하였다. 입력 문장과 동일한 문장을 제외한 문장으로 평가를 진행했으며, 토큰 단위의 BLEU-4 0.234, ROUGE_L 0.459, CIDEr 2.041의 성능을 보였으나, 패러프레이즈 생성 데이터 양이 크게 증가하였다. 본 연구는 문장 간의 의미적으로 동일한 정보를 정확하게 추출할 수 있게 됨으로써 정보 추출, 온톨로지 생성에 도움이 될 것이다. 또한 이러한 기법이 챗봇에서 사용자의 의도 탐지 및 MRC와 같은 자연어 처리의 여러 분야에 유용한 자원으로 사용될 것이다.

  • PDF

The Construction of URI-Based Human Resource Information from Science and Technology Papers (과학기술 문헌으로부터의 URI 기반 인력정보 구축)

  • Jung Han-Min;Lee Seung-Woo;Sung Won-Kyung;Kang In-Su
    • The Journal of the Korea Contents Association
    • /
    • v.6 no.9
    • /
    • pp.152-163
    • /
    • 2006
  • The development of Semantic Web basically requires knowledge induced from the formalization and semantization of information, and thus ontology should be introduced as a knowledgization tool. URI(Universal Resource Identifier) is an indispensible scheme to uniquely indicate individuals on ontology. However, it is difficult to find the use cases of URI in real data including science and technology papers. This paper describes the method to construct internal and external human resource information based on URI from the papers. We use co-authors, e-mails, publication date, and affiliation for discriminating authors with the same strings. HRST(Human Resources devoted to Science and Technology) is referred to acquire URIs for human resource. We expect the internal and external human resource information would be adopted to outcome analysis applications such as researcher network analysis and outcome statistics.

  • PDF

Implementation a Philosophy Ontology based on Knowledge of Text Contents (텍스트 내용 지식 기반의 철학 온톨로지 구축)

  • Kim Jung-Min;Choi Byoung-Il;Kim Hyoung-Joo
    • Journal of KIISE:Computing Practices and Letters
    • /
    • v.11 no.3
    • /
    • pp.275-283
    • /
    • 2005
  • Ontologies are the core components of the Semantic Web and knowledge-based systems. But it is difficult to find useful ontologies in actual domains. In order to build useful domain ontology, the conceptualization of the domain knowledge by knowledge experts of the specific domain and the specification of conceptualized knowledge with formal languages by ontology designers are required. In addition, structured and detailed guidelines and methods should be provided to be shared by the development team members. However, existing ontology building methodologies define and describe the skeletal structure of the whole building process at the top-layer. We build a useful academic ontology that is based on the conceptual knowledge structure in the domain of philosophy, and propose a detailed methodology to build a text ontology based on Topic Maps. Our methodology consists of two phases, ontology modelling and ontology implementation. We implement a philosophy knowledge portal to support retrieving and navigating of the philosophy knowledge.

uLAMP: Unified Linguistic Asset Management Platform for Natural Language Processing (uLAMP: 자연어 처리를 위한 자원 통합 관리 플랫폼)

  • Um, Jung-Ho;Shin, Sung-Ho;Choi, Sung-Pil;Jung, Hanmin
    • The Journal of the Korea Contents Association
    • /
    • v.12 no.12
    • /
    • pp.25-34
    • /
    • 2012
  • Due to the development of wireless devices such as smart-phone and internet, a lot of linguistic resources actively are opened in each area of expertise. Also, various systems using semantic web technologies are developing for determining whether such information are useful or not. In order to build these systems, the processes of data collection and natural language processing are necessary. But, there is few systems to use of integrating software and data required those processes. In this paper, we propose the system, uLAMP, integrating software and data related to natural language processing. In terms of economics, the cost can be reduced by preventing duplicated implementation and data collection. On the other hand, data and software usability are increasing in terms of management aspects. In addition, for the evaluation of uLAMP usability and effectiveness, user survey was conducted. Through this evaluation, the advantages of the currentness of data and the ease of use are found.

X-TOP: Design and Implementation of TopicMaps Platform for Ontology Construction on Legacy Systems (X-TOP: 레거시 시스템상에서 온톨로지 구축을 위한 토픽맵 플랫폼의 설계와 구현)

  • Park, Yeo-Sam;Chang, Ok-Bae;Han, Sung-Kook
    • Journal of KIISE:Computing Practices and Letters
    • /
    • v.14 no.2
    • /
    • pp.130-142
    • /
    • 2008
  • Different from other ontology languages, TopicMap is capable of integrating numerous amount of heterogenous information resources using the locational information without any information transformation. Although many conventional editors have been developed for topic maps, they are standalone-type only for writing XTM documents. As a result, these tools request too much time for handling large-scale data and provoke practical problems to integrate with legacy systems which are mostly based on relational database. In this paper, we model a large-scale topic map structure based on XTM 1.0 into RDB structure to minimize the processing time and build up the ontology in legacy systems. We implement a topic map platform called X-TOP that can enhance the efficiency of ontology construction and provide interoperability between XTM documents and database. Moreover, we can use conventional SQL tools and other application development tools for topic map construction in X-TOP. The X-TOP is implemented to have 3-tier architecture to support flexible user interfaces and diverse DBMS. This paper shows the usability of X-TOP by means of the comparison with conventional tools and the application to healthcare cancer ontology management.

Creating the Future: The Direction and Strategy for Advanced Korea(A-KOREA) (미래창조 선도국가(A-KOREA)의 방향성과 추진전략)

  • Ha, W.G.;Choi, M.S.;Kim, S.M.
    • Electronics and Telecommunications Trends
    • /
    • v.28 no.2
    • /
    • pp.115-131
    • /
    • 2013
  • 본고에서는 인류문명의 탄생과 발전의 원동력을 커뮤니케이션 혁명에 두고, 인류역사를 언어문명, 문자문명, 인쇄문명 그리고 초연결 창조문명으로 구분한다. 이러한 전제하에서, 21세기 초엽에 우리가 목격하고 있는 '편재하는 인터넷 시대'를 초연결 창조문명 태동기로 본다. 본고의 목적은 이러한 창조문명 시대의 도래를 배경으로 미래창조국가의 프레임과 추진 전략을 고찰하는 데 있다. 이를 위해 초연결 융합창조망을 단계별로 구축하여 국가자원을 보다 잘 연결하고(Connected), 과학기술과 산업 그리고 인프라 등을 융합하여(Convergent), 새로운 성장동력과 국민복지를 창출하는(Creative) $C^3$ 기반 미래창조 선도국가(Advanced Korea for All: A-KOREA)의 방향성을 제시한다. 또한 'A-KOREA'를 실현하기 위해 기반 형성 단계, 도약 단계, 성숙 단계. 행성 단계로 구분한 후 각 단계별 추진 전략을 도출한다. 마지막으로 인류 신문명 시대의 미래창조 선도국가로 진입하기 위한 국가리더십의 표출 경로를 정리하여 보았다.

  • PDF