• 제목/요약/키워드: 분류-언어

검색결과 1,099건 처리시간 0.03초

웹 정보의 자동 의미연계를 통한 학술정보서비스의 확대 방안 연구 (A Exploratory Study on the Expansion of Academic Information Services Based on Automatic Semantic Linking Between Academic Web Resources and Information Services)

  • 정도헌;유소영;김환민;김혜선;김용광;한희준
    • 정보관리연구
    • /
    • 제40권1호
    • /
    • pp.133-156
    • /
    • 2009
  • 이 연구에서는 KISTI NDSL의 학술논문 정보를 웹 학술자원과 연계하는 실험적 연구를 수행함으로써 KISTI의 정보 유통 서비스의 확대 가능성을 살펴보고자 하였다. 이를 위해 웹 학술자원을 수집하여 STEAK 시스템을 이용한 자동 의미 연계를 생성하고 이를 학술논문 검색결과와 결합하였다. 시스템의 검색 정확률을 평가한 결과 매크로 정확률은 62.6%, 마이크로 정확률은 66.9%를 보였으며, 자동연계 성능에 대한 전문가 평가는 76.7점을 보였다. 주제 범주별 전문가 평가는 본 연구를 통해 의미연계를 잘 수행하는 경우에 높게 측정되어 시스템적 성능과 동일한 경향을 보였다. 이 연구는 다양한 웹 학술자원의 서비스 연계를 위하여 논문정보로부터 생성한 언어자원을 의미색인에 사용한 것으로 이를 통해 지속적인 웹 자원의 학술적 활용에 대한 가능성을 제시하고자 하였다.

XML 데이타 처리를 위한 XML-QL to SQL 번역기 (An XML-QL to SQL Translator for Processing XML Data)

  • 장경자;이기호
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제8권1호
    • /
    • pp.1-8
    • /
    • 2002
  • XML이 다양한 유형의 웹 데이타를 구성하고 교환하기 위한 국제적인 표준으로 제안되었다. 다양한 애플리케이션에서 필요로 하는 데이타가 XML 문서에 저장되어 있을 때, 그 데이타를 검색하는 것은 중요한 일이다. 본 논문에서는 XML 문서를 관계형 데이타베이스 시스템에 저장하는 방법과 저장된 XML 데이타를 XML-QL로 질의하여 검색하는 방법을 제안한다. 즉, XML의 저장 방법을 제안하고 저장된 XML 데이타를 검색하기 위해 XML-QL로 들어온 질의를 관계형 데이터베이스 시스템의 전용 질의 언어인 SQL로 변환시켜 주는 번역기를 설계 및 구현한다. 본 논문의 의의는 번역기에 대한 설계와 구현을 자세히 기술하므로 번역기의 가능성을 보여주고 XML 질의의 포괄적인 분류와 그에 대한 SQL 관계형 질의로의 매핑을 보여주고 있다는 점이다.

유해 사이트를 접속하는 안드로이드 앱을 문자열 분석으로 검사하는 시스템 (A String Analysis based System for Classifying Android Apps Accessing Harmful Sites)

  • 최광훈;고광만;박희완;윤종희
    • 정보처리학회논문지A
    • /
    • 제19A권4호
    • /
    • pp.187-194
    • /
    • 2012
  • 안드로이드 기반 스마트폰 앱의 바이너리 코드를 오프라인 상에서 분석하여 유해 사이트 목록에 포함된 서버에 접속하는지 여부를 판단하는 시스템을 제안하고, 실제 앱에 대해 적용한 실험 결과를 제시한다. 주어진 앱의 바이너리 코드를 Java 바이트 코드로 역 컴파일하고, 문자열 분석을 적용하여 프로그램에서 사용하는 모든 문자열 집합을 계산한 다음, 유해 매체물을 제공하는 사이트 URL을 포함하는지 확인하는 방법이다. 이 시스템은 앱을 실행하지 않고 배포 단계에서 검사할 수 있고 앱 마켓 관리에서 유해 사이트를 접속하는 앱을 분류하는 작업을 자동화 할 수 있는 장점이 있다. DNS 서버를 이용하거나 스마트폰에 모니터링 모듈을 설치하여 차단하는 기존 방법들과 서로 다른 단계에서 유해 앱을 차단함으로써 상호 보완할 수 있는 방법이 될 수 있다.

기계가독형사전에서 상위어 판별을 위한 규칙 학습 (Learning Rules for Identifying Hypernyms in Machine Readable Dictionaries)

  • 최선화;박혁로
    • 정보처리학회논문지B
    • /
    • 제13B권2호
    • /
    • pp.171-178
    • /
    • 2006
  • 기계가독형사전(Machine Readable Dictionary)에서 단어의 정의문에 나타나는 항목 단어의 상위개념을 추출하는 대부분의 연구들은 전문가에 의해 작성된 어휘패턴을 사용하였다. 이 방법은 사람이 직접 패턴을 수집하므로 시간과 비용이 많이 소모될 뿐만 아니라, 자연언어에는 같은 의미를 가진 다앙한 표현들이 존재하므로 넓은 커버리지를 갖는 어휘패턴들을 수집하는 것이 매우 어렵다는 단점이 있다. 이런 문제점들을 해결하기 위하여, 본 논문에서는 구문적 특징만을 이용한 상위어 판별 규칙을 기계학습함으로써 기존에 사용되었던 어휘패턴의 지나친 어휘 의존성으로 인한 낮은 커버리지 및 패턴 수집의 문제를 해결하는 방법을 제안한다. 제안한 방법으로 기계학습된 규칙들을 상위어 자동추출과정에적용한 결과 정확도 92.37% 성능을 보였다. 이는 기존 연구들보다 향상된 성능으로 기계학습에 의해 수집된 판별규칙이 상위어 판별에 있어서 어휘패턴의 문제를 해결할 수 있다는 것을 입증하였다.

프로덕트 라인 개발에서 피쳐 모델의 명세화 기법 (Feature Model Specification Method in Product-Line Development)

  • 송재승;김민성;박수용
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권11호
    • /
    • pp.1001-1014
    • /
    • 2003
  • 빠르게 변화하는 시장의 요구에 대응하고자 특정 영역에 속하는 애플리케이션 간의 재사용을 높이려는 프로덕트 라인 개발 방법에 대한 연구가 활발하게 진행되고 있다. 프로덕트 라인 개발 방법에서는 영역 내의 여러 애플리케이션들 간의 차이점과 공통점을 분류하는데 피쳐 모델링이라는 분석 방법을 주로 사용하고 있다. 기존 피쳐 모델링에서는 피쳐를 비정형적으로 명세화하기 때문에 모호성, 이해의 오류, 잘못된 해석 등의 문제가 발생하고 있다. 피쳐를 추상화하여 도메인에 독립적인 메타 모델로 나타내고 정형화 기법을 도입하여 명세화 한다면 기존의 피쳐 모델에서 발생하는 문제점들을 해결할 수 있을 것이다. 따라서 본 논문에서는 첫째, 메타 수준에서의 피쳐 모델링을 통하여 피쳐의 구조와 속성을 정의한 후 다중 패러다임 정형화 명세 언어를 사용하여 피쳐를 명세화하는 기법을 제시하였다. 둘째, 피쳐에 대한 정형화 명세 프로세스를 기술하였으며, 셋째, 명세화된 피쳐들 간에 발생할 수 있는 문제점들을 해결하기 위한 피쳐 상호작용 관리기법을 정의하였다. 그리고 마지막으로, 제시된 피쳐의 정형화 명세 기법을 분산 미팅 스케줄러 시스템에 적용시켜보았다.

분산 메모리 환경에서의 ABox 실체화 추론 (ABox Realization Reasoning in Distributed In-Memory System)

  • 이완곤;박영택
    • 정보과학회 논문지
    • /
    • 제42권7호
    • /
    • pp.852-859
    • /
    • 2015
  • 최근 지식 정보의 양이 방대해지면서, 대용량 온톨로지를 효과적으로 추론하는 연구가 활발히 진행되고 있다. 이러한 추론 방법들은 TBox 분류와 ABox 실체화로 나누어진다. TBox 추론은 스키마의 무결성과 종속성을 주로 다룬다면, ABox 추론은 인스턴스 위주의 다양한 문제를 다루어서 실제 응용에서의 중요성이 매우 크다. 따라서 본 논문은 클래스의 제약 조건을 분석하고, 이를 통해 인스턴스가 속하는 클래스를 추론할 수 있는 방법을 제안한다. 객체 지향 언어 기반의 분산 파일 시스템을 활용했던 기존 방법과 달리 함수형 프로그래밍 기반의 인 메모리 시스템인 스파크를 통해 대용량 온톨로지 실체화 방법에 대해서 설명한다. 제안하는 기법의 효율성을 검증하기 위해 W3C의 Wine 온톨로지를 이용해 인스턴스를 생성(1억 2천만~6억개의 트리플)하고 실험을 수행하였다. 6억개의 트리플을 대상으로 진행한 실험의 경우 전체 추론 시간이 51분(696 K Triple/sec)이 소요되었다.

과학기술 유튜브 채널의 유형과 스토리텔링 전략에 대한 다학제적 연구 : 활동형 채널을 중심으로 (Multidisciplinary Research for Types and Storytelling Strategies of Science Technology YouTube Channel : focused on Activity-centered Type Video Channel)

  • 김혜영;유동환
    • 한국과학예술포럼
    • /
    • 제37권3호
    • /
    • pp.113-123
    • /
    • 2019
  • 본 연구는 영상콘텐츠 산업과 과학문화 산업의 지형 변화에서 시작되었다. 모바일 과학기술 영상 콘텐츠는 수요와 정책적 지원에 따라 성장 가능성이 예견된다. 본 연구의 목적은 과학기술 관련 모바일 영상콘텐츠 활성화를 위해 현황을 분석하여 기획 및 제작시의 시사점을 제시하는 것이다. 따라서 본 논문은 모바일 영상 중 영향력이 가장 큰 유튜브의 과학기술 채널의 영상을 사례로 하여 유형 및 스토리텔링 분석을 시도하는 융복합적 연구를 진행하였다. 연구결과 및 내용은 다음과 같다. 첫째, 과학기술 유튜브 채널 글로벌 선도그룹의 영상 콘텐츠는 과학기술의 맥락과 활동에 따라 활동형, 해설형, 비평형의 세 유형으로 범주화된다. 둘째, 언어의존성이 낮고 재매개 가능성이 높은 활동형 채널은 다시 라이프 해킹형, 소품 제작형, 파괴형, 탐구형으로 분류된다. 셋째, 활동형 채널들의 핵심 스토리텔링 전략은 일상적 소재를 전문과학기술적 방법을 통해 다루는 익숙함과 낯섦의 조화이다. 이러한 연구결과를 바탕으로 국제적 경쟁력을 가질 수 있는 킬러 콘텐츠 기획 및 제작을 기대한다.

한국어와 표준 중국어 부분 중첩 의성·의태어에 대한 운율 형태론적 분석의 문제와 최적성 이론적 분석을 통한 대조 분석 (Study into prosodic morphological analysis in Korean and Standard Chinese partial reduplication and contrastive analysis using optimality theory)

  • 장재웅
    • 비교문화연구
    • /
    • 제49권
    • /
    • pp.275-301
    • /
    • 2017
  • 본 논문은 부분 중첩으로 만들어진 한국어 상징 부사를 대상으로 한 중국 학자 왕홍군(王洪君)의 운율 형태론적 분석의 문제점과 한계를 지적하기 위해 작성되었다. 필자는 왕홍군(王洪君)과는 달리 부분 중첩 현상을 일관되게 접두사화로 가정하고, 접두사 부가 방식에 대한 분류를 시도해 보았으며, 그 결과 어간의 형태, 특히 말음으로 나타나는 소리 자질은 접두사 부가의 양상을 결정하는데 중요한 요인임을 알 수 있었다. 또한 표준 중국어 의성어 부분 중첩 현상에서 접두사 부가에 대한 최적성 이론적 분석을 보이고 이를 토대로 한국어와 표준 중국어 의성 의태어의 제약 등급 순위를 대조한 결과 중첩의 적용 양식이 같음을 확인할 수 있었다. 아울러 두 언어에서 공히 설단음 /t/와 유음 /l/이 특별한 지위를 갖고 있는 이유를 기능론적 관점에서 설명하였다. 이로써 본 논문에서는 최적성 이론의 틀 안에서 중요한 몇 개의 제약과 그들의 특정 등급만으로 다양한 유형의 한국어와 표준 중국어의 부분 중첩 의성 의태어를 쉽게 분석할 수 있음을 보였다.

브렉시트 캠페인 기간 동안 영어 미디어에 나타난 이민자들 (Migrant Representation in the English-language Media during the Brexit Campaign)

  • 이재승
    • 비교문화연구
    • /
    • 제45권
    • /
    • pp.325-348
    • /
    • 2016
  • 본 논문은 브렉시트 캠페인 기간 동안 영어권 국가, 영국, 미국, 캐나다, 그리고 호주의 미디어에서 이민자들이 어떻게 표현되는지 살펴본다. 코퍼스 지원 담화연구의 틀을 사용한 본 연구는 브렉시트 국민투표 캠페인이 시작된 날부터 국민투표가 실시되기 전 날까지(2016년 4월 15일-6월 22일) 검색기간으로 설정하고, 검색어 'Brexit'가 포함된 모든 기사를 수집하여 브렉시트 캠페인 코퍼스를 구축하였다. 수집된 코퍼스 자료를 통해서 이민자를 나타내는 어휘들, IMMIGRANT, MIGRANT, 그리고 REFUGEE의 빈도를 관찰하고, 이 어휘들과 함께 나타나는 연어를 분석하였다. 또한 세 어휘의 연어들을 사회적 행위자 범주에 따라 분류 및 분석하였다. 분석 결과, IMMIGRANT의 연어는 법적 상태 및 출신지역 어휘들과 연관성이 있고, MIGRANT는 경제적인 용어들과 주로 연어 관계에 있으며, REFUGEE는 큰 수를 나타내는 어휘와 관련성이 있는 것으로 나타났다. 그리고 이민자들은 기능범주, 유형범주, 그리고 평가범주를 통해서 묘사되며, 특히 영국과 미국의 미디어에서 이민자들이 부정적으로 그려지고 있는 것으로 관찰되었다. 본 연구를 통하여 특정 현상 및 특정 집단의 사람들을 가리킬 때 특정 어휘가 사용되며, 코퍼스 지원 언어분석이 해당 사회의 사회 문화 정치적 상황을 파악하는데 도움이 된다는 것을 확인할 수 있었다.

더미 기반 부채널 분석 대응기법 신규 취약점 - Case Study: XMEGA (Novel Vulnerability against Dummy Based Side-Channel Countermeasures - Case Study: XMEGA)

  • 이종혁;한동국
    • 정보보호학회논문지
    • /
    • 제29권2호
    • /
    • pp.287-297
    • /
    • 2019
  • 부채널 분석에 안전하게 암호 알고리즘을 구현하는 경우, 설계자들은 일반적으로 1차 마스킹 기법과 하이딩 기법을 혼합하여 사용한다. 1차 마스킹 기법과 하이딩 기법을 혼합하여 사용한 구현은 충분한 안전성과 효율성 모두 만족하는 방법이다. 그러나 더미 연산이 실제 연산과 구별될 수 있다면, 공격자는 설계자가 더미 연산을 추가함으로써 의도한 공격 복잡도보다 낮은 공격 복잡도로 비밀 키를 획득할 수 있다. 본 논문에서는 C언어 이용 시 더미 연산에 사용되는 변수의 형태를 4가지로 분류하고, 변수의 형태를 달리 사용하여 하이딩 대응기법을 적용한 경우 모두에 대해 더미 연산을 구분할 수 있는 신규 취약점을 제시한다. 그리고 이에 대한 대응기법을 제시한다.