• 제목/요약/키워드: language model

검색결과 2,775건 처리시간 0.029초

오피니언 분류의 감성사전 활용효과에 대한 연구 (A Study on the Effect of Using Sentiment Lexicon in Opinion Classification)

  • 김승우;김남규
    • 지능정보연구
    • /
    • 제20권1호
    • /
    • pp.133-148
    • /
    • 2014
  • 최근 다양한 정보채널들의 등장으로 인해 빅데이터에 대한 관심이 높아지고 있다. 이와 같은 현상의 가장 큰 원인은, 스마트기기의 사용이 활성화 됨에 따라 사용자가 생성하는 텍스트, 사진, 동영상과 같은 비정형 데이터의 양이 크게 증가하고 있는 것에서 찾을 수 있다. 특히 비정형 데이터 중에서도 텍스트 데이터의 경우, 사용자들의 의견 및 다양한 정보를 명확하게 표현하고 있다는 특징이 있다. 따라서 이러한 텍스트에 대한 분석을 통해 새로운 가치를 창출하고자 하는 시도가 활발히 이루어지고 있다. 텍스트 분석을 위해 필요한 기술은 대표적으로 텍스트 마이닝과 오피니언 마이닝이 있다. 텍스트 마이닝과 오피니언 마이닝은 모두 텍스트 데이터를 입력 데이터로 사용할 뿐 아니라 파싱, 필터링 등 자연어 처리기술을 사용한다는 측면에서 많은 공통점을 갖고 있다. 특히 문서의 분류 및 예측에 있어서 목적 변수가 긍정 또는 부정의 감성을 나타내는 경우에는, 전통적 텍스트 마이닝, 또는 감성사전 기반의 오피니언 마이닝의 두 가지 방법론에 의해 오피니언 분류를 수행할 수 있다. 따라서 텍스트 마이닝과 오피니언 마이닝의 특징을 구분하는 가장 명확한 기준은 입력 데이터의 형태, 분석의 목적, 분석의 결과물이 아닌 감성사전의 사용 여부라고 할 수 있다. 따라서 본 연구에서는 오피니언 분류라는 동일한 목적에 대해 텍스트 마이닝과 오피니언 마이닝을 각각 사용하여 예측 모델을 수립하는 과정을 비교하고, 결과로 도출된 모델의 예측 정확도를 비교하였다. 오피니언 분류 실험을 위해 영화 리뷰 2,000건에 대한 실험을 수행하였으며, 실험 결과 오피니언 마이닝을 통해 수립된 모델이 텍스트 마이닝 모델에 비해 전체 구간의 예측 정확도 평균이 높게 나타나고, 예측의 확실성이 강한 문서일수록 예측 정확성이 높게 나타나는 일관적인 성향을 나타내는 등 더욱 바람직한 특성을 보였다.

구내 스캔바디의 형태에 따른 임플란트의 디지털 스캔 정확도 및 구강 내 노출 높이에 따른 라이브러리 중첩 정확도 비교 연구 (Accuracy of implant digital scans with different intraoral scanbody shapes and library merging according to different oral exposure height)

  • 정병준;이영후;홍성진;백장현;노관태;배아란;김형섭;권긍록
    • 대한치과보철학회지
    • /
    • 제59권1호
    • /
    • pp.27-35
    • /
    • 2021
  • 목적: 현재 임상에서 스캔바디를 이용한 임플란트의 디지털 인상이 활용되고 있으나 스캔바디의 형태에 따른 스캔의 정확도에 대한 연구는 부족한 실정이다. 본 연구의 목적은 구내 스캔바디의 형태에 따른 스캔의 정확도를 비교하고, 구강 내 노출 높이에 따른 라이브러리 중첩 정확도를 비교하기 위함이다. 재료 및 방법: 덴티폼 상에서 36번 치아를 삭제 후 모델 스캐너로 스캔하여 3D 프린터로 주모형을 출력하였다. 첫 번째 실험으로 세 종류(A, B, C)의 구내 스캔바디를 준비하여 각 그룹마다 다음과 같은 실험을 하였다: 36번 부위에 임플란트를 이상적인 위치로 식립 후 스캔바디를 15 N으로 체결하였다. 스캔바디가 체결된 주모형을 모델 스캐너로 스캔하여 master reference file (대조군)을 STL (Standard Tessellation Language) file로 생성하였다. 이후 구강 스캐너로 10회의 연속적인 스캔을 시행하여 10개의 STL file (실험군)을 생성하였다. 3D 측정 소프트웨어를 이용하여 대조군과 실험군들의 STL file들을 중첩한 후 좌표계 상에서 다음과 같은 값들을 도출하였다: 1) 스캔바디 상 특정 point의 거리 편차 2) 스캔바디 장축의 각도 편차. 두 번째 실험으로는 스캔바디의 구강내 노출 높이에 따른 라이브러리 중첩 정확도를 비교하기 위해 스캔바디 스캔 데이터를 7, 4.5, 2.5, 1.5, 1.0, 0.5 mm 총 6 가지 높이로 준비하여 라이브러리 파일과 중첩하였다. 전체가 노출된 7 mm 데이터를 대조군으로 하여 거리 편차와 각도 편차를 계산하였다. 결과: 첫번째 실험에서 A, B 스캔바디 간(P = .278), B, C 스캔바디 간(P = .568), C, A 스캔바디 간(P = .711) 스캔 파일의 거리 편차 모두 유의한 차이가 나타나지 않았다. A, B 스캔바디 간(P= .568), B, C 스캔바디 간(P = .546), C, A 스캔바디 간(P = .112) 스캔 파일의 각도 편차 또한 모두 유의한 차이가 나타나지 않았다. 또한 스캔바디는 구강 내 노출 높이가 높은 실험군(GH, Gingival Height = 4.5)의 라이브러리 중첩 정확도가 높이가 낮은 실험군(GH = 0.5)보다 통계적으로 유의하게 높았다 (P < .05). 결론: 스캔바디의 각기 다른 형태에 따른 스캔 정확도는 유의한 차이가 없었으며, 스캔바디의 구강 내 노출 높이에 따라 라이브러리 중첩의 정확도는 증가한다. 추후 in vivo 환경에서 더 다양한 형태의 스캔바디를 이용한 후속연구가 필요할 것이다.

죽방렴의 문화유산적 가치와 비즈니스적 가치 탐색 연구 (A Research of Cultural Heritage and Business Value of the Juk-Bang-Ryeum(Fishing Instrument made-by Bamboo Weir))

  • 강명화;이경주;권호종;정대율
    • 예술인문사회 융합 멀티미디어 논문지
    • /
    • 제8권12호
    • /
    • pp.425-435
    • /
    • 2018
  • 본 연구는 경남 사천지역에 잔존해 있는 죽방렴의 실제 현황조사와 여러 역사적 문헌 고찰을 통해 죽방렴의 문화적 가치와 비즈니스 가치를 연구하여 지역문화자원으로서의 가치를 입증하고 세계농어업유산과 세계문화유산의 등재에 필요한 기초자료를 만드는 것이 목적이다. 농업과 더불어 수산업은 인류 역사에 있어 지대한 의미를 가진다. 특히, 삼면이 바다로 둘러싸인 우리나라의 지정학적 요인으로 인하여 매우 중요한 산업으로 발전하여 왔다. 그럼에도 불구하고 기르는 양식산업 이전 원시산업의 채집, 수렵할 때부터 이어온 여러 어로방식 중 실제로 남아있는 것은 거의 없는 실정이다. 경남 남해안의 사천과 남해지역에는 오백년 이전부터 지금까지 존재하여 실제로 운영하는 '죽방렴'이 있다. 이것은 예전부터 국가의 중요한 어업자원으로 관리되어져 왔다는 것을 여러 문헌적 연구를 통하여 알 수 있었다. 죽방렴은 자연지리적인 해협의 조류 흐름을 이용하여 고기를 채집하는 과학적 원리에 기초하여 만들어진 것으로 우리조상들의 지혜가 담긴 것이다. 조사결과, 죽방렴과 관련한 독특한 지역공동체의 문화가 존재하였으며, 주민들에게도 중요한 자산으로 관리되어져 왔다. 죽방렴은 이러한 역사, 인문학적 가치뿐만 아니라, 과학적 어로원리 이해교육과 해양어로작업 체험장과 같은 교육적 가치와 주변의 역사유적 및 지질환경자원과 연계하여 지역의 중요한 관광자원으로서 비즈니스적 가치를 지닌다. 결론적으로 죽방렴은 우리의 소중한 문화유산으로서 전승해야할 주요 자산인 것이다.

의존 구문 분석을 이용한 질의 기반 정답 추출 (Query-based Answer Extraction using Korean Dependency Parsing)

  • 이도경;김민태;김우주
    • 지능정보연구
    • /
    • 제25권3호
    • /
    • pp.161-177
    • /
    • 2019
  • 질의응답 시스템은 크게 사용자의 질의를 분석하는 방법인 질의 분석과 문서 내에서 적합한 정답을 추출하는 방법인 정답 추출로 이루어지며, 두 방법에 대한 다양한 연구들이 진행되고 있다. 본 연구에서는 문장의 의존 구문 분석 결과를 이용하여 질의응답 시스템 내 정답 추출의 성능 향상을 위한 연구를 진행한다. 정답 추출의 성능을 높이기 위해서는 문장의 문법적인 정보를 정확하게 반영할 필요가 있다. 한국어의 경우 어순 구조가 자유롭고 문장의 구성 성분 생략이 빈번하기 때문에 의존 문법에 기반한 의존 구문 분석이 적합하다. 기존에 의존 구문 분석을 질의응답 시스템에 반영했던 연구들은 구문 관계 정보나 구문 형식의 유사도를 정의하는 메트릭을 사전에 정의해야 한다는 한계점이 있었다. 또 문장의 의존 구문 분석 결과를 트리 형태로 표현한 후 트리 편집 거리를 계산하여 문장의 유사도를 계산한 연구도 있었는데 이는 알고리즘의 연산량이 크다는 한계점이 존재한다. 본 연구에서는 구문 패턴에 대한 정보를 사전에 정의하지 않고 정답 후보 문장을 그래프로 나타낸 후 그래프 정보를 효과적으로 반영할 수 있는 Graph2Vec을 활용하여 입력 자질을 생성하였고, 이를 정답 추출모델의 입력에 추가하여 정답 추출 성능 개선을 시도하였다. 의존 그래프를 생성하는 단계에서 의존 관계의 방향성 고려 여부와 노드 간 최대 경로의 길이를 다양하게 설정하며 자질을 생성하였고, 각각의 경우에 따른 정답추출 성능을 비교하였다. 본 연구에서는 정답 후보 문장들의 신뢰성을 위하여 웹 검색 소스를 한국어 위키백과, 네이버 지식백과, 네이버 뉴스로 제한하여 해당 문서에서 기존의 정답 추출 모델보다 성능이 향상함을 입증하였다. 본 연구의 실험을 통하여 의존 구문 분석 결과로 생성한 자질이 정답 추출 시스템 성능 향상에 기여한다는 것을 확인하였고 해당 자질을 정답 추출 시스템뿐만 아니라 감성 분석이나 개체명 인식과 같은 다양한 자연어 처리 분야에 활용 될 수 있을 것으로 기대한다.

국내용 애니메이션 사운드 라이브러리 구축 방안 (A Program for Korean Animation Sound Libraries)

  • 임영규
    • 만화애니메이션 연구
    • /
    • 통권15호
    • /
    • pp.221-235
    • /
    • 2009
  • 애니메이션 영상물에서 사용되는 사운드는 거의 모두가 인위적으로 만들어진다. 많은 수의 사운드는 실제의 소리를 녹음해서 사용하기도 하고, 신디사이저와 같은 전문 음향장비로 제작된 가상적 사운드를 여러 가지 방법으로 가공하여 사용하기도 한다. 한 편의 애니메이션은 적지 않은 양의 사운드를 소비하는데, 그를 위한 제작비용 또한 만만치 않다. 이렇게 해서 만들어진 사운드들은 여러 다른 영상작품에 사용될만한 가치가 충분히 있음에도 불구하고, 그렇지 못한 것이 현실이다. 본 논문은 이러한 사운드 소스들을 현 시장상황 하에서 새로운 부가가치로 인정받을 수 있는 '디지털 콘텐츠'로 활용하는 방안에 대하여 논의해 보려한다. 현재 가장 성공적인 디지털 콘텐츠 유통모델로 인정받고 있는 미국 Apple사의 iTunes Music Store 시스템은 국내 음원시장에서의 적용이 가능하다. 연구결과 이 시스템은 사운드의 창작자가 스스로 온라인 스토어의 콘텐츠 제공자로서 역할을 주도하며, 동시에 사용자는 간편한 방법과 저렴한 비용으로 원하는 콘텐츠를 제공 받을 수 있다는 특성을 갖고 있다. 그리고 이러한 시스템을 구축 할 때 반드시 필요한 것이, 원하는 데이터를 짧은 시간 안에 검색 가능하게 해 주는 검색 시스템인데, 이 부분은 우리말의 특징을 고려하여 새롭게 디자인 되어야 하는 부분일 것이다. 본 논문에서는 위키 시스템을 활용하여, 검색 작업과 더불어 사용자 스스로가 데이터베이스를 구축하고 다른 사용자들과 그것을 공유할 수 있도록 하는 방안을 제시하려 한다. 이러한 시스템을 바탕으로 국내판 애니메이션 사운드 라이브러리라는 새로운 음원 디지털 콘텐츠로써 국내 음원시장 개척의 발판을 마련하고자 한다.

  • PDF

SLEDS:비동기 마이크로프로세서를 위한 상위 수준 사건구동식 시뮬레이터 (SLEDS:A System-Level Event-Driven Simulator for Asynchronous Microprocessors)

  • 최상익;이정은;김의석;이동익
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제29권1호
    • /
    • pp.42-56
    • /
    • 2002
  • WHDL이나 Verilog와 같은 기존의 하드웨어 기술 언어(Hardware Description Language)를 이용하여 비동기 마이크로세서를 모델링하고 시뮬레이션을 수행할수 있으나 핸드셰이크 프로토콜 (handshake protocol) 에 의해 동작하는 비동기 마이크로프로세서의 기술이 지나치게 복잡해진다. 결과적으 로 성능 평가 시간이 너무 길어져 상위 수준(system level)에서의 효과적인 설계 공간 탐색에 많은 어려움을 겪는다. 따라서 상위 수준에서 비동기적 특성인 핸드 셰이크 프로토콜을 쉽게 모델링하고 빠른시간 내에 효과적으로 시뮬레이션할수 있는 방법론과 도구가 필요하다. 이런 목적 하에 프로세서 모델링과 시 뮬레이션을 통하여 성능 평가를 수행할수 있는 자동화 도구 SLEDS(System Level Event Driven Simulator)를 개발하였다. 본 도구의 궁극적 목표는 프로세서를 구성하는 모듈들의 지연을 조절하여 (delay balancing)전체적으로 프로세서가 고성능을 얻을수 있도록 최적화 조건을 구하는 것이다. 이와 더불어 정의된 행위를 실제로 수행함으로써 예상한 결과와 실제 결과를 비교하여 설계가 제대로 되었는지 상위 수준에서의 검증을 목표로 한다.

파이프라인 방식의 버스를 위한 비 동기식 주 기억장치의 설계 및 구현 (Design and Implementation of Asynchronous Memory for Pipelined Bus)

  • 한우종;김수원
    • 전자공학회논문지B
    • /
    • 제31B권11호
    • /
    • pp.45-52
    • /
    • 1994
  • 최근 고성능 마이크로 프로세서들의 가격 경쟁력에 힘입어 공유 버스 방식의 다중 처리기 시스템이 많이 등장하고 있다. 이들 다중 처리기 시스템들은 주기억장치의 구조에 따라 성능이 크게 달라질 수 있다. 주기억장치의 중요성은 마이크로 프로세서들이 고속화 되어감에 따라 더욱 커지고 있다. 개개의 마이크로 프로세서들을 위한 캐시 메모리가 대부분의 시스템에서 채용되고 있으나 여전히 공유되는 주기억장치의 접근 특성은 다중 처리기 시스템의 성능과 확장성을 제약하는 요소가 된다. 본 논문에서는 파이프라인 방식의 시스템 버스의 효율성을 최대한 유지하면서 주기억장치 구현의 유연성을 제공하는 비동기적 주기억장치의 구조를 제안하며 그 효과를 시뮬레이션을 통하여 보이고 있다. 시스템 버스로는 고속 중형 컴퓨터를 위하여 설계된 HiPi+Bus를 모델로 하고 있으며 Verilog를 이용하여 시뮬레이션 하였다. 이 시뮬레이션을 통하여 제안된 비동기적 주기억장치 구조가 시스템 버스의 사용률을 낮추어 줌으로써 시스템의 성능과 확장성을 향상시킴을 알 수 있었다. 또한 제안된 구조를 구현하기 위한 구현 방법상의 변수들을 평가 하였으며 구현된 주기억장치를 시험 프로그램을 이용한 시험 환경에서 시험하여 그 동작과 유용성을 확인하였다.

  • PDF

잠정적 부적합 문서와 어휘 근접도를 반영한 어휘 그래프 기반 질의 확장 (Query Expansion Based on Word Graphs Using Pseudo Non-Relevant Documents and Term Proximity)

  • 조승현;이경순
    • 정보처리학회논문지B
    • /
    • 제19B권3호
    • /
    • pp.189-194
    • /
    • 2012
  • 본 논문에서는 정보검색 성능 향상을 위해 잠정적 적합 문서 및 부적합 문서와 어휘 그래프를 이용한 질의 확장 방법을 제안한다. 언어모델에 의한 초기 검색 결과 상위 문서들은 질의 어휘 조합과 근접도를 기반으로 핵심 질의를 포함하는 문서들로 구성된 핵심 질의 클러스터와 핵심 질의를 포함하지 않는 문서들로 구성된 비핵심 질의 클러스터로 분류된다. 이때, 핵심 질의 클러스터는 잠정적 적합 문서 집합으로, 비핵심 질의 클러스터는 잠정적 부적합 문서 집합으로 본다. 각 클러스터는 어휘들과 질의 어휘와의 가까운 정도에 따라 어휘 그래프로 표현된다. 각 어휘에 대한 중요도는 핵심 질의 클러스터 그래프에서의 어휘 가중치에서 비핵심 질의 클러스터 그래프에서의 어휘의 가중치를 빼서 계산한다. 이는 부적합 문서에서 높은 가중치를 갖는 어휘는 확장 질의에서 제외시키는 역할을 한다. 중요도가 높은 어휘 순으로 확장할 질의를 선택한다. 웹 문서 테스트컬렉션인 TREC WT10g에서의 실험 결과에서 제안 방법이 언어모델(LM)에 비해 평균 정확률의 평균(MAP)에서 9.4% 성능 향상을 보였다.

한반도 기후변화의 시각적 표현을 위한 Google Earth 활용 (Using Google Earth for a Dynamic Display of Future Climate Change and Its Potential Impacts in the Korean Peninsula)

  • 윤경담;정유란;윤진일
    • 한국농림기상학회지
    • /
    • 제8권4호
    • /
    • pp.275-278
    • /
    • 2006
  • 전자기후도의 대중홍보 및 사용자 접근성 개선을 위해 개방구조의 Google Earth 플랫폼 상에서 전자기후도를 시연할 수 있는 시스템을 구축하였다. 전국 56개 기상관서에서 1971-2000 기간 중 관측한 일 최고 및 최저기온자료를 토대로 270 m 해상도로 규모를 축소시킨 평년 전자기후도와 2011-2100 기간 중 예상 기온편차를 더한 미래 전자기후도, 이 자료에 근거하여 추정한 벚꽃개화기 분포도, 충북 청원지역에 한해 미세지형의 효과를 반영한 30 m 해상도 전자기후도 및 벚꽃개화일 예상도 등을 이미지 파일로 변환하였다. 이들을 이용하여 사용자와 상호작용 없이 현재, 20년후, 50년후, 80년후의 벚꽃개화일, 최저기온, 최고기온을 표현하는 시스템을 KML로 제작하였다. 이 시스템을 구현하기 위해 Windows XP 환경에서 Google Earth 4beta를 사용하였으며 Apache 2.2.3과 PHP 5.1.6 기반의 웹 서버를 구동하였다. 효과적인 시연을 위해 30인치 크기의 고해상도 대형 모니터를 사용하였으며 중첩될 이미지들도 이러한 해상도에 맞추어 제작되었다. 이 시스템을 이용한 전자기후도 시연회가 여러 차례 성공적으로 개최되었다.

수용자 반응 중심의 광고비평과 커뮤니케이션 실효성 - KT&G TV광고 텍스트를 중심으로 - (Advertisement Criticism through Audience Response and Communication Efficacy - focused on KT&G TV-CM text -)

  • 이현우
    • 디자인학연구
    • /
    • 제19권5호
    • /
    • pp.233-242
    • /
    • 2006
  • 이 연구의 목적은 수용자의 반응을 통해 광고텍스트의 커뮤니케이션 실효성을 규명하는 데 있다. 이를 위해 KT&G TV광고를 사례로 질적인 접근을 했다. 또한 연구대상 광고 수용자의 특성과 세부적인 연구방법을 논의하고 집단 심층면담과 개별 심층면담을 통해 작성된 의미기술문과 출현주제를 광역주제로 통합하고 이를 차원화한 다음 애매한 광고 텍스트의 해독 코드, 수용자의 텍스트에 대한 반응 등을 분석했다. 연구결과, 연구대상 광고텍스트의 해독에 있어 수용자들은 (1) 언어 (2) 시각 (3) 기술 (4) 수사 등의 다양한 해독 코드와 (1) 언어 (2) 거시 (3) 스키마 (4) 비언어 (5) 사회-문화 등의 복합적 수용요인을 비판적으로 활용하고 있음을 알 수 있었다. 광고 수용자들은 인지, 판단, 감정, 행동 차원에서 상이한 해독 전략을 활용하고 있었는데, 전략적 애매성은 인지적 차원에서 그 실효성이 가장 크게 나타나고 수용자의 인지, 감정, 행동의 모든 단계에 걸쳐 효과를 발휘하기에는 한계를 가진 것으로 나타났다. 마지막으로, 질적인 방법에 치중한 본 실증연구의 한계는 보다 심층적인 계량적-질적 연구를 통해 보완되어야 함을 제언했다.

  • PDF