• Title/Summary/Keyword: 정보 모델

Search Result 23,503, Processing Time 0.045 seconds

Sentence Compression based on Sentence Scoring Reflecting Linguistic Information (언어 정보를 반영한 문장 점수 측정 기반의 문장 압축)

  • Lee, Jun-Beom;Kim, So-Eon;Park, Seong-Bae
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2021.05a
    • /
    • pp.389-392
    • /
    • 2021
  • 문장 압축은 원본 문장의 중요한 의미를 보존하는 짧은 길이의 압축 문장을 생성하는 자연어처리 태스크이다. 문장 압축은 사용자가 텍스트로부터 필요한 정보를 빠르게 획득할 수 있도록 도울 수 있어 활발히 연구되고 있지만, 기존 연구들은 사람이 직접 정의한 압축 규칙이 필요하거나, 모델 학습을 위해 대량의 데이터셋이 필요하다는 문제점이 존재한다. 사전 학습된 언어 모델을 통한 perplexity 기반의 문장 점수 측정을 통해 문장을 압축하여 압축 규칙과 모델 학습을 위한 데이터셋이 필요하지 않은 연구 또한 존재하지만, 문장 점수 측정에 문장에 속한 단어들의 의미적 중요도를 반영하지 못하여 중요한 단어가 삭제되는 문제점이 존재한다. 본 논문은 언어 정보 중 품사 정보, 의존관계 정보, 개체명 정보의 중요도를 수치화하여 perplexity 기반의 문장 점수 측정에 반영하는 방법을 제안한다. 또한 제안한 문장 점수 측정 방법을 활용하였을 때 문장 점수 측정 기반 문장 압축 모델의 문장 압축 성능이 향상됨을 확인하였으며, 이를 통해 문장에 속한 단어의 언어 정보를 문장 점수 측정에 반영하는 것이 의미적으로 적절한 압축 문장을 생성하는 데 도움이 될 수 있음을 보였다.

Study on Recognizing User Intention Using User Behavior State Transition Model (사용자 행동 상태 전이 모델을 이용한 사용자 의도 파악 방법 연구)

  • Jung, Hanmin;Lee, Hyejin;Lee, Seok-Hyoung;Choi, Heeseok
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2020.07a
    • /
    • pp.123-125
    • /
    • 2020
  • 정보 서비스를 포함한 웹 서비스에서 사용자 의도를 파악하는 것은 해당 사용자에게 맞춤형 서비스를 제공하기 위한 중요한 단서가 된다. 본 연구는 과학기술 대표 정보 서비스인 ScienceON에 맞춤형 서비스를 도입하기 위해 사용자가 해당 서비스를 사용하는 과정에서 발생시키는 사용자-서비스 간 상호작용인 사용자 행동을 분석하고 사용자 의도를 파악하여 동적으로 맞춤형 서비스를 제공하는 방식을 제안한다. 특히, 사용자 행동 상태 전이 모델을 도입하여 사용자가 반복적으로 행하는 검색 행동과 내비게이션 행동을 추적하고 의도를 파악할 수 있도록 한다. 288,200 건의 웹 로그 분석을 통해 만들어진 상태 전이 모델과 특정 사용자 로그를 분석하여 본 연구가 어떻게 사용자 의도를 파악할 수 있는 지를 보여준다.

  • PDF

An Design and Implementation of YOLO-based Fruit Classification Model. (YOLO 기반 과실 분류 모델 설계 및 구현)

  • Koo, Bon-Geun;Jeong, Da-Un;Kim, Ji-Young;Choi, Ji-Won;Park, Jang-Woo;Cho, Young-Yun;Shin, Chang-Sun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2021.11a
    • /
    • pp.47-50
    • /
    • 2021
  • 일반적으로, 과실 재배 농가에서의 과실 분류 작업은 많은 노동력을 필요로 한다. 최근 코로나19 방역조치로 외국인 근로자 입국 제한으로 인해 농가에서는 인력 수급에 어려움을 겪고 있다. 본 연구에서는 이러한 농가 피해 상황을 해소하고 수급 문제를 해결하기 위해 YOLO 기반 과실 분류 모델설계 및 구현을 소개한다. 본 모델을 기반으로 여러 과실 중 사과에 적용하여 인력이 많이 동원되는 선별과정을 YOLO의 객체 인식을 통해 해결하고 적은 비용으로 효율성 있는 분류 모델을 구축한다.

A Design of HTML Tag Stack and HTML Embedding Method to Improve Web Document Question Answering Performance of BERT (BERT 의 웹 문서 질의 응답 성능 향상을 위한 HTML 태그 스택 및 HTML 임베딩 기법 설계)

  • Mok, Jin-Wang;Lee, Hyun-Seob
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2022.11a
    • /
    • pp.583-585
    • /
    • 2022
  • 최근 기술의 발전으로 인해 자연어 처리 모델의 성능이 증가하고 있다. 그에 따라 평문 지문이 아닌 KorQuAD 2.0 과 같은 웹 문서를 지문으로 하는 기계 독해 과제를 해결하려는 연구가 증가하고 있다. 최근 기계 독해 과제의 대부분의 모델은 트랜스포머를 기반으로 하는 추세를 보인다. 그 중 대표적인 모델인 BERT 는 문자열의 순서에 대한 정보를 임베딩 과정에서 전달받는다. 한편 웹 문서는 태그 구조가 존재하므로 문서를 이해하는데 위치 정보 외에도 태그 정보도 유용하게 사용될 수 있다. 그러나 BERT 의 기존 임베딩은 웹 문서의 태그 정보를 추가적으로 모델에 전달하지 않는다는 문제가 있었다. 본 논문에서는 BERT 에 웹 문서 태그 정보를 효과적으로 전달할 수 있는 HTML 임베딩 기법 및 이를 위한 전처리 기법으로 HTML 태그 스택을 소개한다. HTML 태그 스택은 HTML 태그의 정보들을 추출할 수 있고 HTML 임베딩 기법은 이 정보들을 BERT 의 임베딩 과정에 입력으로 추가함으로써 웹 문서 질의 응답 과제의 성능 향상을 기대할 수 있다.

A Study on Development of Subject-based Community Model by Link of Content -Focused on Life Science- (콘텐트 연계를 통한 주제기반 커뮤니티 모델 개발 연구 -생명과학 분야를 중심으로-)

  • Bu-Young Ahn;Seon-Heui Choi;Yong-Ju Shin;Soon-Young Kim
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2008.11a
    • /
    • pp.607-610
    • /
    • 2008
  • 국내외 연구자들은 각자의 분야에서 다양하고 중요한 연구를 수행하면서 그 연구결과물을 생산하고 있다. 연구결과물의 형태는 학회지 및 학술대회 논문, 연구보고서, 특허, 연구노트, 세미나 발표자료, 학교교재, 신문 및 잡지의 기사 등 매우 다양하다. 이런 다양한 연구결과물을 같은 학문 분야, 같은 주제의 연구자들끼리 서로 공유하고 교환하기 위해서는 정보의 자유로운 이용에 근거한 커뮤니티 환경이 필요하다. 이에, 국가 과학기술정보 유통기관인 한국과학기술정보연구원(KISTI)에서 보유하고 있는 문헌 콘텐트와 사실 콘텐트를 주제별로 분류하고 재가공하여 특정 주제분야 전문 연구자들을 위한 오픈 아카이빙, 오픈 액세스 개념을 적용한 커뮤니티 모델을 개발하여 제공하고자 한다. 본 커뮤니티 모델은 요즘들어 가장 많은 연구가 진행되고 있는 생명과학 분야의 연구결과물을 중심으로 개발하였다. 커뮤니티 모델을 개발하기 위하여 1) KISTI가 보유하고 있는 콘텐트 현황을 조사하고, 2) 그 중에서 생명과학분야 콘텐트의 형태와 특성을 분석하고, 3) 연구자들이 연구결과물을 자유롭게 업로드/다운로드할 수 있는 웹 환경의 플랫폼을 설계하였다.

The Development of Competency Model for teacher of informatics in secondary education (중등 정보교사의 역량모델 개발)

  • Ko, Young-Min;Kim, Daeyoung;Kim, Hanil
    • The Journal of Korean Association of Computer Education
    • /
    • v.19 no.4
    • /
    • pp.33-43
    • /
    • 2016
  • Recently in order to ensure future competitiveness in schooling a paradigm shift which focuses on key competency is demanded. In these circumstances, there are lots of researches on competency in other subjects. However, in informatics the number of researches relate to competency is lacking. Thus, the purpose of this study is to develop competency model for teacher of informatics in high school. For achieving this purpose, we develop research methods and procedures, and conduct several researches such as Focus Group Interview and surveys. Overall research process of this study is as follows: First, we develop competencies of informatics teachers, which consist of 6 categories, 17 competencies, and 66 behavioral indexes as a draft. Second, we verify the content validity of the competencies through FGI, and revise the competencies into 5 categories, 11 competency-units, and 159 behavioral indexes. Third, we conduct a survey for verification of the revised content validity again to informatics teachers, professors and researches. As a result, the major findings of the survey reveal that the Conbarch's ${\alpha}$ of each competency-units is over .9, and that the appropriateness of all items is over 3.5. According to this result, we confirm our competency model for teacher of informatics in secondary education.

Mesh Simplification for Volume and Boundary Preservation (볼륨과 경계보존을 고려한 메쉬 간략화)

  • 조진화;김성수;김영택
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10b
    • /
    • pp.583-585
    • /
    • 1999
  • 대부분의 3차원 모델을 가시화해주기 위한 시스템들은 삼각 메쉬를 기반으로 한 모델 표현법을 사용하고 있다. 이러한 시스템들은 복잡한 3차원 모델을 원격 엑세스할 때에는 모델을 가공하지 않으면 전송 및 랜더링시에 많은 제약이 따른다. 이러한 전송 시간과 랜더링 시간, 저장공간을 줄이기 위해 모델을 간략화하거나 압축하는 많은 기법들이 소개되어져 왔다. 본 논문에서는 메쉬 간략화를 위해 소개되어진 많은 다른 방법에서 사용한 에지 축약(Edge Collapse) 기반의 간략화 알고리즘을 제시한다. 기본적인 접근 방법으로는 기하학적인 메쉬 구성요소들 중에서 에지의 특성에 따라 제거 기준을 설정한 후 간략화해 나간다. 에지 축약을 위한 우선순위와 축약 이후 새로운 정점의 위치는 원본 모델을 참조하지 않고 간략화 단계의 모델에서 삼각형의 연결성(connectivity)과 정점의 위치만을 이용하여 계산하였다. 실제 이 방법은 방대한 다각형 메쉬를 간략화할 경우 메모리를 효율적으로 이용할 수 있으며, 처리 속도를 개선할 수 있다. 또한, 간략화이후에도 원본 모델의 위상(topology)을 유지할 수 있는 기법을 제시하고 있다. 세가지 모델에 대한 실험 결과에서 기하학적 에러(geometric error)를 최소화하였고, Heckbert가 제안한 방법(QSlim V2.0)과의 비교에서는 처리 속도가 개선되었다.

  • PDF

Genetic Optimization of Information Granules-based Fuzzy Model (정보 입자 기반 퍼지 모델의 유전자적 최적화)

  • Park Keon-Jun;Lee Dong-Yoon;Oh Sung-Kwun
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2005.11a
    • /
    • pp.467-470
    • /
    • 2005
  • 퍼지모델은 주로 경험적 방법에 의해 추출되기 때문에 보다 구체적이고 체계적인 방법에 의한 동정 및 최적화 될 필요성이 요구된다. 따라서 본 논문에서는 퍼지 모델의 전반부 및 후반부의 구조 동정과 파라미터 동정에 있어서 최적의 구조 및 파라미터를 찾기 위해 유전자 알고리즘을 이용한다. 초기 퍼지 모델을 설계하기 위해 유전자 알고리즘을 이용하여 입력 변수의 수, 선택될 입력 변수, 멤버쉽함수의 수, 그리고 후반부 형태를 결정한다. 구축된 퍼지 모델은 유전자 알고리즘에 의해 세대를 거듭하면서 전반부 파라미터를 자동 동조함으로써 최적의 퍼지 모델을 설계한다. 또한 구조 동정 및 파라미터 동정을 동시에 시행함으로서 정보 입자 기반 퍼지 모델의 유전자적 최적화를 도모한다. 마지막으로 제안된 퍼지 모델은 표준 모델로서 널리 사용되는 수치적인 예를 통하여 평가한다.

  • PDF

Denoising Response Generation for Learning Korean Conversational Model (한국어 대화 모델 학습을 위한 디노이징 응답 생성)

  • Kim, Tae-Hyeong;Noh, Yunseok;Park, Seong-Bae;Park, Se-Yeong
    • 한국어정보학회:학술대회논문집
    • /
    • 2017.10a
    • /
    • pp.29-34
    • /
    • 2017
  • 챗봇 혹은 대화 시스템은 특정 질문이나 발화에 대해 적절한 응답을 해주는 시스템으로 자연어처리 분야에서 활발히 연구되고 있는 주제 중 하나이다. 최근에는 대화 모델 학습에 딥러닝 방식의 시퀀스-투-시퀀스 프레임워크가 많이 이용되고 있다. 하지만 해당 방식을 적용한 모델의 경우 학습 데이터에 나타나지 않은 다양한 형태의 질의문에 대해 응답을 잘 못해주는 문제가 있다. 이 논문에서는 이러한 문제점을 해결하기 위하여 디노이징 응답 생성 모델을 제안한다. 제안하는 방법은 다양한 형태의 노이즈가 임의로 가미된 질의문을 모델 학습 시에 경험시킴으로써 강건한 응답 생성이 가능한 모델을 얻을 수 있게 한다. 제안하는 방법의 우수성을 보이기 위해 9만 건의 질의-응답 쌍으로 구성된 한국어 대화 데이터에 대해 실험을 수행하였다. 실험 결과 제안하는 방법이 비교 모델에 비해 정량 평가인 ROUGE 점수와 사람이 직접 평가한 정성 평가 모두에서 더 우수한 결과를 보이는 것을 확인할 수 있었다.

  • PDF

Region-of-Interest Detection from a Facial Image Using Active Model (동적 모델을 이용한 얼굴 영상에서의 관심 영역 추출)

  • 이형일;김경환
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10b
    • /
    • pp.343-345
    • /
    • 2001
  • 본 논문에서는 얼굴 인식 시스템에서 정면 얼굴 영상의 관심 영역을 추출하는 효율적인 방법을 소개한다. 얼굴 인식 시스템은 얼굴 요소의 특징 을 이용하여 자동으로 얼굴을 구별하는 시스템이며, 얼굴 요소로는 눈, 코, 입과 눈썹을 주로 사용한다. 본 논문에서는 동적 모델을 이용하여 눈과 입을 관심영역으로 하여 이 영역을 세 단계로 나누어 추출한다. 첫 번째로 전체 얼굴 모델을 이용하여 similarity 변환을 적용하여 얼굴의 대략적인 위치를 찾는다. 두 번째 단계에서는 얼굴 근처에서 각각의 눈, 입 모델을 비선형 변환을 적용하여 정확한 눈과 입을 찾는다. 최종 단계에서는 이렇게 맞춘 모델로부터 전체 모델을 변형시킨 후에 변형전과 후의 적합성을 판단하여 최종 위치를 정한다. 제안한 알고리즘을 130명의 영상에 대하여 적용한 결과 눈을 정확하게 추출한 경우는 120명이고, 입을 정확히 추출한 경우는 119명이었다. 본 논문에서 제안하는 관심 영역 추출 방법은 일반적인 모델 방법에 특정 목적에 적합한 모델을 혼합한 방법으로 일반적인 모델만을 적용한 방법과 프로젝션 분석 등의 특정 목적만을 위한 방법보다 좋은 결과를 얻을 수 있었다.

  • PDF