• 제목/요약/키워드: 언어 종류

검색결과 367건 처리시간 0.023초

센서 노드 데이터 표현을 위한 표현 언어 설계 (Design of Presentation Language for Sensor Node Data Representation)

  • 강민재;유상근;김용운;김형준;정회경
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2011년도 추계학술대회
    • /
    • pp.815-816
    • /
    • 2011
  • 인터넷의 보급과 컴퓨터 네트워크 기술의 발전과 함께 USN(Ubiquitous Sensor Network)을 실현하기 위한 연구가 활발히 이루어지고 있다. USN의 센서 노드는 다양한 종류의 센서를 탑재하여 개별적인 센서 정보 서비스를 제공한다. 이를 위해 XML 기반의 웹 서비스 환경에서 활용되고, 불특정 사용자가 서비스를 이용할 수 있도록 표준화된 데이터 표현 언어가 필요하다. 이에 본 논문에서는 USN 응용 서비스에 필요한 센서 정보를 표준화된 형태로 표현하기 위한 센서 데이터 표현 언어를 설계하였다. 이는 USN 분야의 기반 기술에 활용되며, 서비스 활성화를 위해 활용 될 것이다.

  • PDF

OWL Web Ontology Language를 위한 Ontology Parser의 설계 (A Design of Ontology Parser for OWL Web Ontology Language)

  • 이미경;박천수;손주찬
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 춘계학술발표대회
    • /
    • pp.573-576
    • /
    • 2004
  • 시맨틱 웹에 이용되는 웹 온톨로지 언어들로는 RDF/RDFS, DAML+OIL, OWL 등이 있으며, 현재 W3C에서는 OWL을 웹 온톨로지 표준 언어로 삼고 있다. 기존의 웹 온톨로지 문서들의 파서는 대부분 RDF를 기반으로 한 Triple 모델을 기반으로 하여 파싱한다. 그러나 OWL의 경우는 triple 형태로 변환시키면 OWL Full의 형태를 가지게 되고 OWL 온톨로지의 표현력과 데이터의 손실을 가져오게 된다. 따라서 OWL 문서의 파싱을 위하여 우리는 OWL Abstract Syntax를 이용하여 Tree 모델을 가지는 OWL 파서를 만들고자 한다. 본 논문에서는 시맨틱 웹에서 사용되는 웹 온톨로지들을 파싱하여 온톨로지 객체 모델을 생성해주는 기능을 가지는 온톨로지 파서를 설계, 구현하였다. 논문에서 설계한 온톨로지 파서는 RDF, DAML+OIL, OWL 웹 온톨로지 문서들을 파싱하여 온톨로지 객체 모델을 생성할 때, RDF 온톨로지의 경우는 Triple 모델 형태로 파싱을 하지만, OWL 온톨로지의 경우에는 OWL Abstract Syntax Tree 모델 형태로 파싱한 후, OOM으로 변환시켜준다. 이를 위해 웹 온톨로지 언어의 종류 구분과 OWL 온톨로지의 경우, OWL Full, OWL DL, OWL Lite의 서브 타입을 구별하는 기능도 추가하였다.

  • PDF

템플릿 기반 미세조정을 통한 토익 모델 훈련 (TOEIC Model Training Through Template-Based Fine-Tuning)

  • 이정우;문현석;박기남;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.324-328
    • /
    • 2022
  • 기계 독해란 주어진 문서를 이해하고 문서 내의 내용에 대한 질문에 답을 추론하는 연구 분야이며, 기계 독해 문제의 종류 중에는 여러 개의 선택지에서 질문에 대한 답을 선택하는 객관식 형태의 문제가 존재한다. 이러한 자연어 처리 문제를 해결하기 위해 기존 연구에서는 사전학습된 언어 모델을 미세조정하여 사용하는 방법이 널리 활용되고 있으나, 학습 데이터가 부족한 환경에서는 기존의 일반적인 미세조정 방법으로 모델의 성능을 높이는 것이 제한적이며 사전학습된 의미론적인 정보를 충분히 활용하지 못하여 성능 향상에 한계가 있다. 이에 본 연구에서는 기존의 일반적인 미세조정 방법에 템플릿을 적용한 템플릿 기반 미세조정 방법을 통해 사전학습된 의미론적인 정보를 더욱 활용할 수 있도록 한다. 객관식 형태의 기계 독해 문제 중 하나인 토익 문제에 대해 모델을 템플릿 기반 미세조정 방법으로 실험을 진행하여 템플릿이 모델 학습에 어떠한 영향을 주는지 확인하였다.

  • PDF

순차적 구문 분석 방법을 반영한 포인터 네트워크 기반의 한국어 의존 구문 분석기 (Korean Dependency Parsing Using Sequential Parsing Method Based on Pointer Network)

  • 한장훈;박영준;정영훈;이인권;한정욱;박서준;김주애;서정연
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.533-536
    • /
    • 2019
  • 의존 구문 분석은 문장 구성 성분 간의 의존 관계를 분석하는 태스크로, 자연어 이해의 대표적인 과제 중 하나이다. 본 논문에서는 한국어 의존 구문 분석의 성능 향상을 위해 Deep Bi-Affine Network와 Left to Right Dependency Parser를 적용하고, 새롭게 한국어의 언어적 특징을 반영한 Right to Left Dependency Parser 모델을 제안한다. 3개의 의존 구문 분석 모델에 단어 표현을 생성하는 방법으로 ELMo, BERT 임베딩 방법을 적용하고 여러 종류의 모델을 앙상블하여 세종 의존 구문 분석 데이터에 대해 UAS 94.50, LAS 92.46 성능을 얻을 수 있었다.

  • PDF

Bidirectional LSTM CRFs를 이용한 한국어 개체명 인식 (Named-entity Recognition Using Bidirectional LSTM CRFs)

  • 송치윤;양성민;강상우
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2017년도 제29회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.321-323
    • /
    • 2017
  • 개체명 인식은 문서 내에서 고유한 의미를 갖는 인명, 기관명, 지명, 시간, 날짜 등을 추출하여 그 종류를 결정하는것을 의미한다. Bidirectional LSTM CRFs 모델은 연속성을 갖는 데이터에 가장 적합한 RNN기반의 심층 학습모델로서 개체명 인식 연구에 가장 우수한 성능을 보여준다. 본 논문에서는 한국어 개체명 인식을 위하여 Bidirectional LSTM CRFs 모델을 사용하고, 입력 자질로 단어뿐만 아니라 품사 임베딩 모델과, 개체명 사전을 활용하여 입력 자질을 구성한다. 또한 입력 자질에 대한 벡터의 크기를 최적화 하여 기본 모델보다 성능이 향상되었음을 증명하였다.

  • PDF

Nearest Neighbor 방법을 이용한 문서 범주화에서 범주 자질의 평가 (An Evaluation of Category Features in Text Categorization Using Nearest Neighbor Method)

  • 권오욱;이종혁;이근배
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1997년도 제9회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.7-14
    • /
    • 1997
  • 문서 범주화에서 문서의 내용에 따라 적합한 범주의 종류와 수를 찾는 문제를 해결하기 위해서는 문서 당 하나의 범주를 할당할 경우에 가장 좋은 성능을 보이는 모델이 효과적일 것이다. 그러므로, 본 논문에서는 문서 당 하나의 범주를 할당할 경우에 좋은 결과를 보이는 k-nearest neighbor 방법을 이용한다. 그리고 k-nearest neighbor 방법을 이용한 문서 범주화의 성능을 향상시키기 위해서, 문서 표현에 사용하는 단어들을 범주 자질의 성격을 갖는 단어들로 제한하는 방법을 제안한다. 제안한 방법은 Router 신문 일년치로 구성된 Router-21578 테스트 집합에서 breakeven point 82%라는 좋은 결과를 보였다.

  • PDF

굴곡가지의 높임법 ( 존대법 ) 최소형 형성론 (AN ANALYSIS OF HONORIFIC MINIMAM FORMS IN KOREAN)

  • 김석득
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1989년도 한글날기념 학술대회 발표논문집
    • /
    • pp.77-80
    • /
    • 1989
  • 높임법의 최소형 정립은 말본범주의 인지뿐만 아니라, 사전의 어휘항복 설정에 절대적 중요성을 갖는다. 굴곡가지의 높임법 낱덩이, 곧 최소형 인지의 요건은 첫째, 분포상 굴곡가지가 줄기에 직접 통합되어야 한다는 것이며, 둘째, 줄기에 직접 통합되는 요소가 높임법의 의미를 가져야 한다는 것이다. 단순형태소가 줄기에 직접 통합하여 존대의 의미를 가지는 것은 홑최소형이 되고, 다른 것과 의무적으로 통합하여 줄기에 직접 통합되는 것은 겹최소형이다. 의무적인 겹최소형이 다시 독립적으로 설 수 있는 비의무적 요소와 통합하여 새로운 존대의 의미를 생성한다면, 이 또한 겹최소형이 된다. 높임의 최소형은 높임법과 의항법의 이차원의 성격을 띤다. 따라서 높임의 최소형의 전 분포는 높임의 등분과 함께, 의향법 체계에 걸쳐 있다. 최소형은 풀이씨의 종류에 따라 다름도 주의할 일이다. 시상법은 높임법의 구성소일 뿐이며, 또한 그 자체 독립하는 것으로 높임법과 의향법과는 그 차원을 달리한다.

  • PDF

통합 사용자 인터페이스에 관한 연구 : 인공 신경망 모델을 이용한 한글 필기체 On-line 인식 (A Study on the Intelligent Man-Machine Interface System: On-Line Recognition of Hand-writing Hangul using Artificial Neural Net Models)

  • 최정훈;권희용;황희융
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1989년도 한글날기념 학술대회 발표논문집
    • /
    • pp.126-131
    • /
    • 1989
  • 본 논문에서는 Error Back Propagation 학습을 이용해 한글 문자를 On-Line 인식하는 시스템을 제안한다. Pointing device의 궤적을 추적해 입력 패턴의 특징(feature)을 추출해 신경 회로망 입력으로 준다. 이때 사용하는 특징은 기본 획 (stroke)의 종류 및 획간의 상대적 위치 관계이다. 학습과정에서는 자소의 정의를 읽어 초성, 중성, 종성에 대해 각 획수마다 정의된 신경회로망의 weight를 조정한다. 인식 과정에서는 초성, 중성, 종성의 순으로 에러가 최소인 획수의 신경회로망 출력을 택하여 2 바이트 조합형 코드로 완성한다. 이로써 Intelligent Man-Machine Interface 시스템중 위치 및 크기에 무관한 전필 입력 시스템을 구현한다.

  • PDF

신문자동인식 시스템을 위한 문자의 분류에 관한 연구 (A Study on the Classify of Character for Newspaper Automatic Recognition System)

  • 이승형;전종익;조용주;남궁재찬
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1989년도 한글날기념 학술대회 발표논문집
    • /
    • pp.209-215
    • /
    • 1989
  • 본 논문에서는 신문자동인식을 위한 신문문자의 분류에 관한 연구를 하였다. 먼저, 문서의 문자를 추출하기 위하여 블럭화를 행한다. 블럭화는 문자열을 찾아 절과절, 단어와 단어 사이를 찾아 분리구간을 정한다음 블럭을 합성 및 분리를 하였다. 다음으로 블럭화된 문자의 종류를 알기 위한 각 문자에 대하여 6 형식 분류를 하여 특성을 조사함으로써 문자분류를 행하였다. 본 연구에서는 실험을 용하여 블럭화는 충실하게 추출이 되어졌고 한글의 모아쓰기 특성과 한문과의 유사한 형식특성 때문에 분류에 어려움이 있었으나 비교적 충실하게 추출하였다.

  • PDF

대체소통으로서 감성콘텐츠 기술의 사업동향 및 발전방향 (Business Trends and Development Directions of Emotional Content Technology as an Alternative Communication)

  • 임명환;주상현
    • 전자통신동향분석
    • /
    • 제31권2호
    • /
    • pp.41-50
    • /
    • 2016
  • 언어나 문자를 대신하여 소통하고 감정을 전달하는 다양한 장르의 콘텐츠 중에 기호나 그림 등을 이용해 아이콘, 이모티콘, 스티커, 캐릭터 등으로 표현하는 디지털 형상들을 비주얼 감성콘텐츠라 할 수 있다. 초기 감성콘텐츠는 소통의 보조수단으로 간단한 이미지였으나, 현재에는 움직이고 소리 나는 영상에 이르기까지 수천 종류가 유통되고 있으며, 메신저 사업의 킬러 서비스로 부상하고 있다. 향후 감성콘텐츠는 언어나 문자로 표현하기 곤란한 사용자의 생각과 느낌을 주고받는 소통의 대체수단으로 정착될 전망이다. 또한, 변형과 편집이 가능한 감성콘텐츠가 개발되어 사용자는 간단한 조작만으로 다양한 감성을 표현할 수 있을 것으로 보인다. 이 논문은 대체소통으로서 비주얼 감성콘텐츠의 개념을 정립하고, 주요 감성콘텐츠의 추진내용과 사업동향 분석, 비즈니스 전략과 기술혁신 발전방향을 제시하고 있다.

  • PDF