• 제목/요약/키워드: 외부 태깅

검색결과 9건 처리시간 0.023초

언어 지식과 통계 정보의 보완적 특성을 이용한 품사 태깅 (Part-of-Speech Tagging Using Complemental Characteristics of Linguistic Knowledge and Stochastic Information)

  • 임희석;김진동;임해창
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1997년도 제9회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.102-108
    • /
    • 1997
  • 기존의 품사 태깅 방법에서 독립적으로 사용해온 언어 지식과 통계 정보는 품사 태깅의 정확도와 처리 범위의 향상을 위해서 상호 보완적인 특성을 갖는다. 이에 본 논문은 언어 지식과 통계 정보의 보완적 특성을 이용한 규칙 우선 직렬 품사 태깅 방법을 제안한다. 제안된 방법은 언어 지식에 의한 품사 태깅 결과를 선호함으로써 규칙 기반 품사 태깅의 정확도를 유지하며, 언어 지식에 의해서 모호성이 해소되지 않은 어절에 통계 정보에 의한 품사 태깅 결과를 할당함으로써 통계 기반 품사 태깅의 처리 범위를 유지한다. 또한, 수정 언어 지식에 의해 태깅 결과의 오류를 보정함으로써 품사 태깅의 정확도를 향상시킨다. 약 2만 어절 크기의 외부 평가 코퍼스에 대해 수행된 실험 결과, 규칙 우선 직렬 품사 태깅 시스템은 통계 정보만을 이용한 품사 태깅의 정확도보다 32.70% 향상된 95.43%의 정확도를 보였다.

  • PDF

의미 기반 정보 검색을 제공하는 이미지 게시판 시스템 (An Image Bulletin Board System providing Semantic-based Searching)

  • 정의현;조동찬
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (A)
    • /
    • pp.733-735
    • /
    • 2004
  • 게시판 시스템은 양방향으로 정보를 교환하는 정보 시스템으로서의 높은 효용을 지니고 있으며, 웹과 결합하여 다양한 정보 시스템의 핵심 요소로 자리잡고 있다. 또한 이미지 등의 멀티미디어 정보를 게시물에 포함하여 효율적인 정보 공유에 사용되고 있다. 그러나 지금까지의 게시판 시스템은 게시물의 내용에 접근하기 위해, 단순한 텍스트 패턴 매칭에 의존하고 있다. 이러한 접근 방식은 텍스트 중심의 게시판에서는 어느 정도 효용을 갖지만. 멀티미디어를 포함하는 게시판의 경우에는 적용되기 어려운 단점을 갖고 있다. 본 논문에서는 이의 해결을 위해 이미지 데이터를 포함하는 게시물에 대해 시맨틱 태깅을 할 수 있는 게시판 시스템에 관하여 논한다. 제안된 시스템은 사전에 정해진 태깅 정보가 코드에 고착되지 않고, 외부에서 지정한 시맨틱 태깅을 동적으로 수용하는 구조물 갖고 있다. 이러한 구조를 통하여 이미지의 종류나 성격에 가장 적합한 태깅을 동적으로 지정할 수 있게 되며. 의미 기반의 검색을 지원하게 된다.

  • PDF

스마트폰 환경에서 사용자의 컨텍스트 추출을 통한 라이프로그 자동 태깅 기법 (Automatic Lifelog Tagging through Context Detection in the Smart Phone)

  • 김병준;김탁은;이기용;김명호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2010년도 한국컴퓨터종합학술대회논문집 Vol.37 No.1(C)
    • /
    • pp.84-89
    • /
    • 2010
  • 최근 스마트폰의 성능이 향상되고 다양한 기능이 추가됨에 따라 기록되는 라이프로그 정보가 급격히 증가하고 있다. 이에 따라 라이프로그를 체계적으로 저장하고 검색하는 일이 중요해지고 있다. 사용자 컨텍스트는 라이프로그 검색의 정확도를 높이기 위한 중요한 요소 중 하나로 논의되어 왔다. 따라서 이를 자동으로 추출하고, 라이프로그의 태깅에 활용하려는 많은 연구가 시도되었다. 그러나 많은 기존 연구들은 컨텍스트를 추출하기 위해 사용자 주변에 센서가 설치되어 있는 환경을 가정하였는데, 이러한 환경은 비용 등의 문제로 일부 제한된 영역에서만 적용 가능하기 때문에, 광범위한 지역에서 사용자의 컨텍스트를 추출할 수 없다는 문제점이 있었다. 본 연구에서는 외부 센서들이 설치된 환경을 가정하지 않고, 스마트폰에 장착된 센서만을 활용하여 사용자의 컨텍스트를 찾아내고, 이를 라이프로그 자동 태깅에 적극 활용하는 방법에 대해 제안한다. 특히 본 연구에서는 기존의 포괄적인 컨텍스트의 정의를 일정 시간 간격동안 지속되는 사용자의 상황으로 한정지어 재정의하고, 이를 라이프로그 태깅에 활용하는 방법에 대해서 논의한다.

  • PDF

외부 상황 정보를 활용하는 적응적 대화 모델의 구현 (Developing an Adaptive Dialogue System Using External Information)

  • 장진예;정민영;박한무;신사임
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.456-459
    • /
    • 2019
  • 대화 행위는 단순한 발화 문장들의 교환을 넘어 발화자들의 다양한 주변 정보를 고려한 종합적인 판단의 결과로 볼 수 있다. 본 논문은 여섯 가지 유형의 외부 상황 정보를 기반으로 적응적 발언을 생성하는 딥러닝 기반 대화 모델을 소개한다. 직접 구축한 상황 정보들이 태깅된 대화 데이터를 바탕으로, 외부 상황 정보를 사용자 발화와 더불어 활용하는 다양한 구조의 신경망 구조를 가지는 모델과 더불어 외부 상황 정보를 사용하지 않는 모델과의 성능에 대해 비교한다. 실험 결과들은 대화 모델의 발화 생성에 있어서 상황 정보 활용의 중요성을 보여준다.

  • PDF

이동통신망을 활용한 무인비행장치 기반 이미지 획득, 전처리, 전송 시스템 (UAV-based Image Acquisition, Pre-processing, Transmission System Using Mobile Communication Networks)

  • 박종홍;안일엽
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 추계학술대회
    • /
    • pp.594-596
    • /
    • 2022
  • 본 논문은 무인비행장치에 탑재된 카메라를 통해 획득한 고화질의 이미지를 무인비행장치 상에서 전처리를 하여 이동통신망을 통해 서버로 전송하기 위한 시스템 및 기법에 관한 것이다. 기존의 이미지 획득 서비스용 무인비행장치의 경우, 무인비행장치에 탑재된 카메라의 외부저장장치에 획득한 이미지를 저장하고, 비행이 완료된 이후에 저장장치를 직접 옮기는 방식으로 이미지를 확인하였다. 이러한 방식의 경우, 외부저장장치를 통해 직접적으로 이미지 데이터를 확인하기 전에는 이미지 획득이나 전처리가 제대로 수행되었는지 확인할 수 없다는 한계점이 존재한다. 또한 해당 데이터는 외부저장장치에만 저장되기 때문에 데이터의 공유가 번거롭다는 단점이 존재한다. 본 논문에서는 위와 같은 문제점을 해결하기 위하여, 원격에서 이미지를 실시간으로 확인 가능한 시스템을 제안한다. 더 나아가, 무인비행장치에서의 촬영을 통한 이미지 획득 외에 지오태깅과 같은 전처리와 이동통신망을 통한 전송까지 수행이 가능한 시스템 및 방법을 제안한다.

  • PDF

제한된 언어 자원 환경에서의 다국어 개체명 인식 (Multilingual Named Entity Recognition with Limited Language Resources)

  • 천민아;김창현;박호민;노경목;김재훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2017년도 제29회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.143-146
    • /
    • 2017
  • 심층학습 모델 중 LSTM-CRF는 개체명 인식, 품사 태깅과 같은 sequence labeling에서 우수한 성능을 보이고 있다. 한국어 개체명 인식에 대해서도 LSTM-CRF 모델을 기본 골격으로 단어, 형태소, 자모음, 품사, 기구축 사전 정보 등 다양한 정보와 외부 자원을 활용하여 성능을 높이는 연구가 진행되고 있다. 그러나 이런 방법은 언어 자원과 성능이 좋은 자연어 처리 모듈(형태소 세그먼트, 품사 태거 등)이 없으면 사용할 수 없다. 본 논문에서는 LSTM-CRF와 최소한의 언어 자원을 사용하여 다국어에 대한 개체명 인식에 대한 성능을 평가한다. LSTM-CRF의 입력은 문자 기반의 n-gram 표상으로, 성능 평가에는 unigram 표상과 bigram 표상을 사용했다. 한국어, 일본어, 중국어에 대해 개체명 인식 성능 평가를 한 결과 한국어의 경우 bigram을 사용했을 때 78.54%의 성능을, 일본어와 중국어는 unigram을 사용했을 때 각 63.2%, 26.65%의 성능을 보였다.

  • PDF

제한된 언어 자원 환경에서의 다국어 개체명 인식 (Multilingual Named Entity Recognition with Limited Language Resources)

  • 천민아;김창현;박호민;노경목;김재훈
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2017년도 제29회 한글및한국어정보처리학술대회
    • /
    • pp.143-146
    • /
    • 2017
  • 심층학습 모델 중 LSTM-CRF는 개체명 인식, 품사 태깅과 같은 sequence labeling에서 우수한 성능을 보이고 있다. 한국어 개체명 인식에 대해서도 LSTM-CRF 모델을 기본 골격으로 단어, 형태소, 자모음, 품사, 기구축 사전 정보 등 다양한 정보와 외부 자원을 활용하여 성능을 높이는 연구가 진행되고 있다. 그러나 이런 방법은 언어 자원과 성능이 좋은 자연어 처리 모듈(형태소 세그먼트, 품사 태거 등)이 없으면 사용할 수 없다. 본 논문에서는 LSTM-CRF와 최소한의 언어 자원을 사용하여 다국어에 대한 개체명 인식에 대한 성능을 평가한다. LSTM-CRF의 입력은 문자 기반의 n-gram 표상으로, 성능 평가에는 unigram 표상과 bigram 표상을 사용했다. 한국어, 일본어, 중국어에 대해 개체명 인식 성능 평가를 한 결과 한국어의 경우 bigram을 사용했을 때 78.54%의 성능을, 일본어와 중국어는 unigram을 사용했을 때 각 63.2%, 26.65%의 성능을 보였다.

  • PDF

바이오로거 체외 부착방법이 점농어(Lateolabrax maculatus)의 혈액성상 및 바이오로거 부착효율에 미치는 영향 (Blood Property and Biologger Attachment Efficiency of Spotted Sea bass Lateolabrax maculatus depending on External Biologger Attachment Methods)

  • 강필준;이근수;오승용
    • 한국해양생명과학회지
    • /
    • 제9권1호
    • /
    • pp.22-32
    • /
    • 2024
  • 바이오로거 외부 부착방법이 점농어 Lateolabrax maculatus(평균 체중 2630.8 g)의 혈액 특성과 바이오로거 부착효율에 미치는 영향을 조사하기 위해 바이오로거 미부착구(대조구), anchor attachment (AA), monofilament attachment (MA) 및 silicon tube attachment (SA) 방식의 4가지 실험구를 설정하였다. 바이오로거 부착 후 1, 7, 14, 28, 56 및 84일에 혈액성상과 바이오로거 부착효율을 조사하였다. 혈액 내 hematocrit, Na+, Cl-, GPT, total protein 농도 및 superoxide dismutase 활성은 바이오로거 외부 부착방법에 영향을 받지 않았다(p>0.05). AA 그룹의 GOT(부착 1일), hemoglobin(56일) 및 total cholesterol(56일 및 84일)와 MA 그룹의 glucose와 cortisol (14일) 및 total cholesterol(84일) 농도는 대조구에 비해 유의하게 높았다(p<0.05). 실험 기간 동안 SA 그룹의 모든 혈액 특성은 대조구와 차이가 없었다(p>0.05). AA, MA 및 SA 그룹의 바이오로거 부착효율은 부착 84일 후 각각 0.0%, 33.3%, 그리고 100.0%였다. 이상의 결과에서 최적의 외부 바이오로거 부착방법은 SA 유형으로 나타났으며, 점농어의 생체원격측정 기술 개발을 위한 기본 정보로 활용될 수 있을 것이다.

사용자 청취 습관과 태그 정보를 이용한 하이브리드 음악 추천 시스템 (A Hybrid Music Recommendation System Combining Listening Habits and Tag Information)

  • 김현희;김동건;조진남
    • 한국컴퓨터정보학회논문지
    • /
    • 제18권2호
    • /
    • pp.107-116
    • /
    • 2013
  • 본 연구에서는 소셜 음악 사이트에서 사용자들이 음악 아이템을 청취한 횟수와 생성한 태그 정보를 혼합하여 음악을 추천하는 시스템을 제안한다. 현재, 상용화된 음악 추천 시스템들은 주로 사용자의 청취 습관과 외부적인 선호도 입력값을 기반으로 음악을 추천하고 있다. 그러나 이 방식은 아직 음악을 청취한 사용자가 많지 않은 새로운 음악이나 청취 정보가 없는 새로운 사용자의 경우 추천하는 데 어려움이 있다. 이 문제를 해결하기 위해서 본 논문에서는 사용자가 선정한 키워드를 아이템에 부여하는 협업 태깅으로 생성된 태그 정보를 활용하였다. 태그의 의미를 파악하여 감정 표현의 정도에 따라 가중치를 부여한 뒤, 태그 점수와 청취 횟수를 혼합하여 음악 아이템의 선호도를 산출하였다. 이를 기반으로 사용자 프로파일을 생성하고 협업 필터링 알고리즘을 수행하였다. 제안하는 추천 방법의 효율성을 평가하기 위해서, 청취 습관 기반 추천, 태그 점수 기반 추천, 하이브리드 추천 방법의 세 가지 추천 방법에 대해서 정확도, 재현율, 그리고 F-measure를 계산하였다. 실험 결과에 대해 통계적 검증을 시행한 결과, 하이브리드 추천 방법이 다른 두 가지 방식보다 통계적으로 유의한 차이를 보여 성능이 우수한 것으로 나타났다.