• 제목/요약/키워드: 기호로서의 언어

검색결과 224건 처리시간 0.03초

한국어 의존 관계 분석과 자질 집합 분할을 이용한 기계학습의 성능 개선 (Analysis of Korean Language Parsing System and Speed Improvement of Machine Learning using Feature Module)

  • 김성진;옥철영
    • 전자공학회논문지
    • /
    • 제51권8호
    • /
    • pp.66-74
    • /
    • 2014
  • 최근에 한국어 의존 관계에 대한 파싱 시스템과 관련된 연구가 소프트웨어 공학자들이나 언어학자들에 의해 다양하게 연구되고 있으며, 시스템 구현은 주로 기계 학습이나 기호 주의를 사용하고 있다. 기계 학습을 사용한 방법은 한국어 문장 데이터가 매우 크기 때문에 시스템 특성상 매우 긴 학습시간을 가지며, 데이터 자체가 가지는 오류로 인하여 한정된 인식율을 가진다. 본 연구에서는 기계학습을 이용한 시스템에 대하여 학습 시간을 줄일 수 있도록 특징들을 자질 집합 모듈로 분할하여 처리하는 방법을 제안하고, 문장수와 반복횟수에 따른 인식율을 분석하였다. 설계된 시스템은 분리된 모듈과 이진 검색을 위한 정렬 기법이 사용되었다. 데이터는 세종 말뭉치로부터 추출한 후 정제된 36,090문장을 사용하였다. 학습 시간은 약 3시간으로 줄었으며, 인식율은 10,000 문장을 50회 학습하였을 때 84.54%로 가장 높았다. 모든 학습 문장(32,481)을 10회 학습하였을 때 인식율은 82.99%이다. 결과적으로 정제된 데이터를 이용하여 시스템이 안정화될 때까지 반복하는 것이 더 효율적이었다.

서브 이미지의 교정을 통한 이미지 기반의 CAPTCHA 시스템 (An Image-based CAPTCHA System with Correction of Sub-images)

  • 정우근;지승현;조환규
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권8호
    • /
    • pp.873-877
    • /
    • 2010
  • CAPTCHA은 스팸이나 로봇에 의한 사이트 자동가입을 막는 계정 생성방지 도구로써, 특정 언어 또는 그림을 해독할 수 있는 인간의 우수한 가독성을 이용한 것으로 일반적으로 컴퓨터 프로그램이 해독하기 어려운 기호, 글자 등을 입력하도록 하여 스팸 또는 자동화 도구 등을 무력화 시키는 보안 기술이다. 하지만 기존에 사용되었던 CAPTCHA 방식은 웹봇 또는 이미지프로세싱, 머신 러닝을 통하여 쉽게 통과할 수 있는 것으로 알려졌다. 본 논문에서는 기존에 사용되었던 Text 기반의 CAPTCHA 시스템과는 달리 이미지 기반의 새로운 CAPTCHA 시스템을 제안한다. 본 논문에서 제공되는 시스템은 일반적으로 현상된 사진의 부분적인 이미지를 추출하여 추출된 이미지의 회전을 통하여 CAPTCHA 시스템을 제공하는 것이다. 사용자 인증은 다음과 같이 검증한다. 먼저 총 8장의 사진에서 각각 서브 이미지를 추출하여, 추출된 서브 이미지를 무작위로 회전시킨다. 무작위로 회전된 서브 이미지를 사용자가 올바르게 교정하면 사용자가 인증된다.

목록규칙에 있어 가계(家系)의 속성과 관계의 기술 (Describing Attributes and Relationships of Families in Cataloging Rules)

  • 이창수
    • 한국도서관정보학회지
    • /
    • 제46권3호
    • /
    • pp.27-49
    • /
    • 2015
  • 이 연구의 목적은 RDA를 중심으로 FRAD, DACS2, KCR2 등을 분석한 것을 토대로 하여, 한국목록규칙에 있어 가계의 속성과 관계의 기술에 대한 규정 방향을 제시하는 것이다. 가계의 속성 기술은 가계의 이름, 유형, 날짜, 장소, 저명인사, 세습칭호, 언어, 가계사, 식별기호에 관한 사항에 대해 분석하였다. 가계의 관계 기술은 저작과 관련된 가계, 표현형과 관련된 가계, 구현형과 관련된 가계, 개별자료와 관련된 가계 등 각각의 자원과 관련된 가계에 관한 기술을 분석하였고, 가계와 개인 간의 관계, 가계와 가계 간의 관계, 가계와 단체 간의 관계에 대한 기술을 분석하였다. 이 연구는 RDA를 중심으로 목록규칙들에서의 가계의 속성과 관계의 기술에 대하여 분석한 내용을 토대로 추후 한국목록규칙에 이를 적용하기 위한 방안을 제시하였다.

기록물 생산기관명 접근점 제어 온톨로지 기술에 관한 연구 (A Study on the Description of Archives Name by Controlled Access Point in Ontology)

  • 강현민
    • 정보관리학회지
    • /
    • 제35권3호
    • /
    • pp.147-164
    • /
    • 2018
  • 기록물 생산기관에 부여된 행정표준기관코드(Standard Administration Code) 식별기호체계를 이용하여 동일 정체성과 동일 신원을 지닌 기록물 최종 생산기관명을 유일한 우선어 형식(preferred form)으로 정의하였다. 또한 동일 정체성과 동일 신원을 지닌 생산기관명에 대해 다양한 형식의 언어와 문자로 알려진 이형형식의 접근점 중에 대표 이름형식 접근점을 선정하고 온톨로지로 기술하였다. 이로써 과거부터 현재에 이르기까지 동일 정체성과 동일 신원의 생산기관이 생산한 모든 기록물에 대해 식별 접근할 수 있도록 하였다. 또한 '출처주의 원칙'과 '원질서 존중의 원칙'이라는 기본적인 기록물 관리 원칙을 온톨로지 환경에서도 준수함으로써, 기록물에 대한 관리방식 개선과 이용자들에게 기록물 접근의 편의성 및 확장된 검색결과를 제공할 수 있도록 하였다.

목록규칙에 있어 개인의 속성과 관계의 기술에 관한 연구 (A Study on the Describing Attributes and Relationships of Person in Cataloging Rules)

  • 안서현;이창수
    • 한국비블리아학회지
    • /
    • 제25권3호
    • /
    • pp.235-261
    • /
    • 2014
  • 본 연구의 목적은 한국목록규칙에 개인의 속성과 관계의 기술을 적용하기 위한 방안을 제시하는 것이다. 이를 위해 FRBR과 FRAD 개념 모형과 AACR2R, RDA, KCR2 등의 목록규칙을 비교 분석하였다. 개인의 속성 기술은 개인의 이름, 날짜, 칭호, 이름의 완전형, 성별, 장소, 소속, 언어, 활동분야와 직업, 전기 정보, 식별기호에 관한 사항에 대해 분석하였다. 개인의 관계 기술은 저작과 관련된 개인, 표현형과 관련된 개인, 구현형과 관련된 개인, 개별자료와 관련된 개인 등 각각의 자원과 관련된 개인에 관한 기술을 분석하였고, 개인과 개인 간의 관계, 개인과 가족 간의 관계, 개인과 단체 간의 관계에 대한 기술을 분석하였다. 각종 목록규칙들의 비교를 통해 개인의 속성 기술과 개인의 관계 기술을 분석한 내용을 토대로 추후 한국목록규칙에 이를 적용하기 위한 방안을 제시하였다.

CUTIG: 정적 분석을 이용한 C언어 단위 테스트 데이타 추출 자동화 도구 (CUTIG: An Automated C Unit Test Data Generator Using Static Analysis)

  • 김택수;박복남;이춘우;김기문;서윤주;우치수
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제36권1호
    • /
    • pp.10-20
    • /
    • 2009
  • 단위 시험은 지속적이고 반복적으로 수행되어야 하기 때문에 높은 비용을 필요로 하는 작업이다. 단위 시험의 자동화에 대한 많은 연구가 있었으나 테스트 데이타의 자동 추출에 대한 연구는 큰 성과를 이루지 못하고 있다. 본 연구에서는 소프트웨어의 소스 코드로부터 테스트 데이타를 자동으로 추출하는 방안에 대해 논의하고 각 단계의 알고리즘을 제시하였다. 또한 테스트 데이타 추출 자동화에 관한 이슈를 소개하고 테스트 데이타 추출 자동화 도구 CUTIG를 소개한다. CUTIG는 실제 소스코드를 이용하여 테스트 데이타를 추출하므로 소프트웨어의 요구사항 명세가 잘 작성되어 있지 않거나 실제 구현과 차이가 있는 경우에도 테스트 데이타를 생성할 수 있다. 또한 이 도구를 통해 개발자가 직접 테스트 데이타를 작성하는 데 소요되는 비용을 절감할 수 있기를 기대한다.

국내 온라인 쇼핑몰의 글로벌화를 위한 디자인 개선방안 연구 (A Study of the Design Improvement Measure for the Globalization of Domestic Online Shopping Malls)

  • 최윤희;조성환
    • 한국콘텐츠학회논문지
    • /
    • 제15권12호
    • /
    • pp.73-80
    • /
    • 2015
  • 1996년 중국으로 수출된 한국 드라마의 인기를 시작으로 세계 시장에서는 이른바 한류 열풍이 시작되었다. 이후 드라마뿐만 아니라 한국의 문화 자체가 한류 시장의 콘텐츠로 급부상하며 한국 제품을 온라인에서 직접 구매하고자 하는 해외 직판 소비자가 큰 폭으로 증가하고 있다. 본 연구는 국내 온라인 쇼핑몰이 해외 시장의 소비자 환경에 적절히 부응하고 있는가를 파악하기 위해 현재 글로벌 마케팅을 진행하고 있는 국내 쇼핑몰 네 곳과 해외의 유명 쇼핑몰 네 곳을 각각 선정하여 디자인 측면을 비교 연구하였다. 그 결과 글로벌 마케팅을 진행하고 있는 국내 온라인 쇼핑몰들이 국가별 인터넷 환경에 대한 이해가 부족하고 문자 정보전달의 한계를 겪고 있으며 의미 전달에 용이한 시각 기호를 적극적으로 활용하지 못하고 있는 실정임이 드러났다. 이에 본 논문은 그러한 문제점에 대한 개선 방안으로 다양한 화면을 배려하는 가변 요소를 디자인에 활용하는 방안, 세계 각국마다 다른 언어의 문제를 해결하기 위해 텍스트를 직관적인 요소로 디자인하는 방안, 발전하는 IT기술을 적극 활용하여 디자인하는 방안 등을 제시하였다.

커뮤니케이션 매체로서 어린이 그림책에 대한 연구 (A Study on Children′s Picture Book as a Communication Medium)

  • 박경희
    • 디자인학연구
    • /
    • 제14권1호
    • /
    • pp.7-16
    • /
    • 2001
  • 인간은 커뮤니케이션을 통해 그들의 생존과 바람직한 사회생활을 영위해 오고 있다. 인간의 커뮤니케이션은 언어에서 문자, 인쇄매체, 전파매체를 통해, 또한 최근에는 통신매체를 통하여 변화하며 확산되고 있다. 문자의 발명 이후 책은 가장 오랜 역사를 지닌 인간 커뮤니케이션 매체로서 인간의 정신세계를 보존, 전승해 왔다. 어린이 그림책 역시 커뮤니케이션 매체로서 정보의 발신자, 메시지, 매체, 수신자라는 요소로 구성되어 커뮤니케이션의 과정이 이루어진다. 작가, 일러스트레이터, 편집자라는 집합군의 발신자는 어린이라는 특별한 수신대상을 분석하여 메시지를 기호화하고 내용을 구성하며 매체를 선정하고 어린이에게 효과적으로 전달하여 커뮤니케이션이 이루어지도록 한다. 어린이라는 수신자의 발달 특성과 그의 욕구를 살펴 볼 때, 그림책의 글과 일러스트레이션이라는 시각매체는 어린이와의 커뮤니케이션을 위해 가장 적절한 것이다. 그래서 그림책은 첫째, 어른과 어린이간의 커뮤니케이션을 통해 어린이가 자아를 발견하고 역할을 수행해 갈 수 있도록 하여 결국 사회와의 커뮤니케이션을 이루게 한다. 둘째, 글과 일러스트레이션의 메시지 해독을 통하여 어린이에게 이 시대 인간 커뮤니케이션의 능력 즉 비주얼 커뮤니케이션과 문자 커뮤니케이션을 경험하고 학습하게 한다.

  • PDF

트랜스미디어에 대한 개념적 고찰 (A Conceptual Study on Transmedia)

  • 윤혜영
    • 한국콘텐츠학회논문지
    • /
    • 제19권11호
    • /
    • pp.644-652
    • /
    • 2019
  • 본 연구는 트랜스미디어라는 개념을 둘러싸고 난립해있는 용어의 문제를 인식하고, 언어기호학의 통합체 이론을 적용하여 개념에 대한 정리와 고찰을 시도하였다. 트랜스미디어에서 접두사 '트랜스'는 횡단과 변형, 초월을 의미한다. 트랜스미디어라는 단어 자체의 이와 같은 다의성은 트랜스미디어 개념을 횡단과 변형, 초월이라는 동사적 계열을 가진 미완의 통합체로 인식할 수 있는 단초를 제공한다. 미디어 기업, 창작자, 사용자처럼 미디어 콘텐츠 분야의 주체이자 주어가 누구냐에 따라 트랜스미디어 개념의 통합체는 트랜스미디어 프랜차이즈, 트랜스미디어 스토리텔링, 프로슈머와 같은 용어와 연결된다. 세 주체가 트랜스미디어의 담화에 참여하는 목적은 IP 활용과 스토리 세계의 확장, 작품 향유로 각각 다르다. 하지만 세 주체가 미디어를 횡단하고 변형하며 초월하는 목적에서 '반복'과 '연장', '확보'와 '연결'이라는 공통의 욕망이 발견된다. 트랜스미디어 프랜차이즈, 트랜스미디어 스토리텔링, 프로슈머와 같은 용어가 트랜스미디어 개념의 '파롤'이라면, 반복과 연장, 확보와 연결은 트랜스미디어 개념의 '랑그'이다.

eCRM을 위한 데이터마이닝 에지전트의 개발 (The Development of the Data Mining Agent for eCRM)

  • 손달호;홍덕훈
    • 한국산업정보학회논문지
    • /
    • 제11권5호
    • /
    • pp.236-244
    • /
    • 2006
  • 전자상거래의 성장에 따라 고객의 특성을 파악하고 고객의 기호에 맞는 정보를 제공하여 구매력에 영향을 주고 동시에 웹사이트 운영자의 정보선별과 관련된 의사결정을 지원하는 시스템도구들이 개발되고 있다. 그러나 이런 시스템도구들은 웹운영기업에 경제적 부담을 주고 컴포넌트화 되어 있지 않아서 원하는 데이터를 수집하기보다는 수집된 데이터에 기업들의 요구정보를 맞춰야 하는 어려움이 있다. 이러한 점을 감안하여 본 연구는 기업의 필요정보에 대한 맞춤형 웹에이전트 시스템의 설계로 도구기반 로그분석을 대신할 수 있는 시스템개발을 연구목적으로 설정하였다. 본 연구에서 개발된 웹에이전트는 설계언어로 Java와 ASP를 이용하였으며 데이터 저장방식은 쿠키를 이용하는 방식으로 구현되었고 장기적 보존 데이터를 위해서 My-SQL의 데이터베이스와 연동될 수 있도록 개발되었다. 본 연구에서 개발된 시스템은 데이터마이닝개념을 이용하여 도구에 분석데이터를 전달시키기보다는 적극적으로 웹사이트의 컴포넌트형 에이전트로 데이터를 가공하도록 하였고 따라서 고객 개인화 인터페이스 설계 뿐 아니라 의사결정과 전문가 시스템의 성격을 지닌 정보제공방식을 마련할 수 있다는 점에서 기여도가 있다고 본다.

  • PDF