• 제목/요약/키워드: 분석

검색결과 272,780건 처리시간 0.124초

분석의 최종 판단자로서의 구문 분석기 (Parser as An Analysis Finisher)

  • 여상화
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 춘계학술발표대회
    • /
    • pp.677-680
    • /
    • 2004
  • 통상적인 언어 처리의 분석 과정은 전처리, 형태소분석, 품사 태깅, 복합 단위 인식, 구문 분석, 그리고 의미 분석 등의 여러 단계로 이루어진다. 분석의 매 단계에서 중의성(Ambiguity)가 발생하며, 이를 해결하기 위한 노력으로 구문 분석 이전의 분석 단계에서도 정확률(Precision)을 높이기 위해, 어휘(Lexical) 정보, 품사정보 그리고 구문 정보 등을 이용한다. 각 단계에서 고급 정보로서의 구문 정보 이용은 구문분석의 중복성과 분석 지식의 중복성을 야기한다. 또한, 기존의 처리 흐름에서는 각 분석 단계에서의 결과는 최종적인 것으로, 이로 인해 다음 분석 단계에 분석 오류를 전파한다. 본 논문에서는 구문 분석기를 분석 결과의 최종 판단자로 이용할 것을 제안한다. 즉, 구문 분석 전단계의 모든 분석 정보는 구문 분석기에 제공되고, 구문분석기는 상향식 구문분석을 수행하면서 이들 정보들로부터 최종의 그리고 최적의 분석 후보를 결정한다. 이를 위해 구문분석기는 한 문장 단위를 입력 받는 기존의 제한을 따르지 않는다. 제안된 방법은 구문분석 앞 단계에서의 잘못된 정보 제공(예: 문장 분리 오류, 품사 오류, 복합단위 인식 오류 등)으로부터 자유로우며, 이를 통해 분석 실패의 가능성을 최대로 줄인다.

  • PDF

웹 로그 분석 모델

  • 권영직;장굉위
    • 한국산업정보학회:학술대회논문집
    • /
    • 한국산업정보학회 2009년도 춘계학술대회 미래 IT융합기술 및 전략
    • /
    • pp.212-219
    • /
    • 2009
  • 본 논문에서는 웹 관리자가 웹 사이트 분석을 위하여 웹 로그(web log) 분석을 통한 필요한 정보를 추출하고, 추출된 데이터를 분석하여 웹 환경을 개선시키고, 웹 사이트 방문자를 위해 더 좋은 서비스를 할 수 있는 새로운 웹 로그 분석 모델을 제안 한다. 이와 같은 목적을 달성하기 위해 본 논문에서는 웹 로그의 개념 및 유형, 웹 로그의 분석 원칙 및 웹 로그 분석 방법을 고찰하였다. 웹 로그 분석 도구로는 Web Log Expert를 활용하였다. 본 논문에서는 이 도구를 이용하여 웹 방문자 수에 대한 통계분석, 인기가 많은 웹 사이트에 대한 페이지분석 및 방문자 IP 분석 등을 실시하였다.

  • PDF

최장일치를 이용한 구문 분석용 형태소 분석기 (Morphological Analyzer using Longest Match Method for Syntactic Analysis)

  • 송연정;이근용;이용석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1999년도 제11회 한글 및 한국어 정보처리 학술대회 및 제1회 형태소 분석기 및 품사태거 평가 워크숍
    • /
    • pp.157-166
    • /
    • 1999
  • 형태소 분석 단계는 자연어 처리 과정의 첫 번째 단계로써 주어진 입력 어절들에 대한 형태소들의 조합을 추출하는 일을 한다. 형태소 분석 시스템의 기본적인 기능은 매우 중요하여 적용되는 형태소 분석 알고리즘에 따라 형태소 분석 시스템의 성능에 영향을 미친다. 그러나 형태소 분석 시스템, 구문 분석 시스템 및 의미 분석 시스템이 연계되어 하나의 자연어 처리 시스템이 구축되는 관점에서는 구문분석 시스템의 부담을 줄여 전체 시스템의 효율을 향상시키기 위하여 구문 분석 시스템의 입력에 적합한 형태소 분석 결과를 생성해주는 일 또한 형태소 분석 시스템의 중요한 역할이라 할 수 있다. 본 시스템은 최장일치법을 이용한 형태소 분석 방법으로 입력 어절에 대한 형태소 분석을 수행하는 동안 분석 후보의 개수를 줄이고 사전 탐색 시간을 줄여준다. 또한 구문분석 시스템의 입력에 적절한 형태소 분석 결과를 생성하여 전체 응용 시스템의 효율성을 향상시킨다.

  • PDF

감성분석 연구 동향 (Sentimental Analysis Research Trends)

  • 이정훈
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2018년도 춘계학술발표대회
    • /
    • pp.358-361
    • /
    • 2018
  • 비정형 데이터 증가로 텍스트 마이닝을 사용해 데이터를 분석하는 연구가 주목받고 있다. 감성분석은 단어와 문맥을 분석하여 텍스트의 감정을 파악하는 기술이다. 본 논문에서는 감성분석 연구 동향, 적용분야, 방법론에 관해 분석하고 기술하려 한다. 감성분석은 2001년 채팅의 감정을 분석하면서 시작되었고, 2008년부터 본격적으로 연구가 진행되었다. 감성분석은 SNS, 상품 후기, 영화평, 뉴스 기사 등 다양한 데이터에 적용되고 있으며, 사회이슈 찬반 분석과 장소 선호도 분석 등 다양한 연구에서 사용되었다. 감성분석 방법은 감성사전을 이용하는 방식과 기계학습을 사용하는 방식으로 나누어지며 분석 방법을 발전시키기 위한 연구가 진행되고 있다.

Java 프로그램의 효율적인 분석을 위한 집합-기반 분석의 변환 (Transformation of Constraint-based Analyses for Efficient Analysis of Java Programs)

  • 조장우;창병모
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권7호
    • /
    • pp.510-520
    • /
    • 2002
  • 본 논문에서는 Java 프로그램에 대한 집합기반 분석 설계 시, 효율적인 분석을 위해 분석의 단위를 조절하는 생성규칙 변환 방법을 제안한다. 기존의 생성규칙을 변환함으로서 기존의 분석보다는 정확성이 감소하지만 보다 효율적인 분석을 설계할 수 있다. 본 방법을 응용한 예로서 기존의식 수준의 클래스 분석과 예외 상황 분석에 대해 생성규칙 변환을 사용하여 효율적인 클래스 분석과 예외상황 분석을 설계하였다. 클래스 분석에서는 메소드와 필드 변수 단위의 분석을 설계하였으며, 예외상황 분석에서는 메소드와 try 구문 단위의 분석을 설계하였다. 그리고 예외상황 분석에서는 식 수준의 분석과 변환된 메소드 수준의 분석이 각 메소드에 대해서 동등한 정보를 제공함을 보였다.

특허분석을 활용한 항해 시스템 기술예측

  • 박은주;정중식
    • 한국항해항만학회:학술대회논문집
    • /
    • 한국항해항만학회 2015년도 춘계학술대회
    • /
    • pp.50-52
    • /
    • 2015
  • 특허는 기술에 대한 광범위한 정보를 포함하고 있다. 기존의 기술예측은 정량적분석으로 시도되었지만 특허분석을 활용하여 정성적분석을 실시하였다. 특허분석을 시행하기 위하여 R 프로그램을 이용하여 주성분분석과 다중선형회귀분석을 실행하였다. 주성분분석과 다중선형회귀분석을 통하여 키워드를 추출하고 추출된 키워드를 통해 기술예측을 실시한다.

  • PDF

Multi-task sequence-to-sequence learning을 이용한 한국어 형태소 분석과 구구조 구문 분석 (Korean morphological analysis and phrase structure parsing using multi-task sequence-to-sequence learning)

  • 황현선;이창기
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2017년도 제29회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.103-107
    • /
    • 2017
  • 한국어 형태소 분석 및 구구조 구문 분석은 한국어 자연어처리에서 난이도가 높은 작업들로서 최근에는 해당 문제들을 출력열 생성 문제로 바꾸어 sequence-to-sequence 모델을 이용한 end-to-end 방식의 접근법들이 연구되었다. 한국어 형태소 분석 및 구구조 구문 분석을 출력열 생성 문제로 바꿀 시 해당 출력 결과는 하나의 열로서 합쳐질 수가 있다. 본 논문에서는 sequence-to-sequence 모델을 이용하여 한국어 형태소 분석 및 구구조 구문 분석을 동시에 처리하는 모델을 제안한다. 실험 결과 한국어 형태소 분석과 구구조 구문 분석을 동시에 처리할 시 형태소 분석이 구구조 구문 분석에 영향을 주는 것을 확인 하였으며, 구구조 구문 분석 또한 형태소 분석에 영향을 주어 서로 영향을 줄 수 있음을 확인하였다.

  • PDF

Multi-task sequence-to-sequence learning을 이용한 한국어 형태소 분석과 구구조 구문 분석 (Korean morphological analysis and phrase structure parsing using multi-task sequence-to-sequence learning)

  • 황현선;이창기
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2017년도 제29회 한글및한국어정보처리학술대회
    • /
    • pp.103-107
    • /
    • 2017
  • 한국어 형태소 분석 및 구구조 구문 분석은 한국어 자연어처리에서 난이도가 높은 작업들로서 최근에는 해당 문제들을 출력열 생성 문제로 바꾸어 sequence-to-sequence 모델을 이용한 end-to-end 방식의 접근법들이 연구되었다. 한국어 형태소 분석 및 구구조 구문 분석을 출력열 생성 문제로 바꿀 시 해당 출력 결과는 하나의 열로서 합쳐질 수가 있다. 본 논문에서는 sequence-to-sequence 모델을 이용하여 한국어 형태소 분석 및 구구조 구문 분석을 동시에 처리하는 모델을 제안한다. 실험 결과 한국어 형태소 분석과 구구조 구문 분석을 동시에 처리할 시 형태소 분석이 구구조 구문 분석에 영향을 주는 것을 확인 하였으며, 구구조 구문 분석 또한 형태소 분석에 영향을 주어 서로 영향을 줄 수 있음을 확인하였다.

  • PDF

강원도에서의 지점빈도분석과 지역빈도분석의 비교 (Comparison between at-site frequency analysis and regional frequency analysis at Gangwon Province)

  • 서동일;김상욱;전영일;한재욱
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2023년도 학술발표회
    • /
    • pp.205-205
    • /
    • 2023
  • 지역 빈도 분석과 점 빈도 분석은 하천 기본계획 및 수공 구조물의 설계에 있어 재현기간 별 확률강우량을 산정하기 위한 방법이다. 점 빈도 분석은 자료의 수가 부족하여 높은 재현기간에 대한 확률강우량을 산정하기에 어려운 점이 있다. 2019년도부터 사용되고 있는 지역빈도분석 방법은 이러한 점을 보완해주고 있다. 지역빈도분석을 수행하기 위해서는 지역의 동질성을 확인하는 과정이 가장 중요한 과정이다. 이러한 동질성을 판단하기 위하여 K-means등의 군집분석과 L-moment 법 등을 사용하고 있다. 이러한 차이점으로 인해 두 방법 간의 정확성은 비교가 어려우나 서로 간의 장점, 단점과 결과 간의 차이를 기반으로 산간지역이 많은 강원도와 같은 지역에 대한 확률강우량 산정의 적절한 방법을 판단해보고자 본 연구를 진행하였다. 지역 빈도 분석은 강원도에 위치한 48개 관측소의 강우 자료 수집 후 고도, 위치, 지속시간 별 강우량을 변수로 지정하고 K-means 분석을 통해 6개의 군집으로 구분하여 수행되었다. 이질성 척도는 관측 자료와 500번의 모의 수행을 통해 결정하였다. 이후 분석된 군집이 동질한 경우 확률분포형에 적합시켜 확률강우량을 산정하였다. 점 빈도 분석은 지역 빈도 분석에서 결정된 군집에서의 최대 강우량과 최소 강우량 관측소의 자료를 이용하여 수행하였다. 본 연구에서는 점빈도분석과 지역빈도분석의 결과를 비교하였으며, 두 가지 분석 방법에 따른 차이의 발생원인 및 특성을 결론으로 제시하였다.

  • PDF

실용적인 위험분석 도구의 개발

  • 이동호;김종기
    • 한국정보시스템학회:학술대회논문집
    • /
    • 한국정보시스템학회 2005년도 춘계학술대회 발표 논문집
    • /
    • pp.176-191
    • /
    • 2005
  • 기존의 정보기술 위험분석 방법론에 대한 연구는 캐나다의 CSE에서 발표한 위험관리 방법론, 미국의 NIST에서 발표한 FIPS 65 정보보호 관리지침에서의 위험분석 방법론, 그리고IS0/IEC JTCl SC27의 정보보호 관리지침 등이 있으며, 위험분석 자동화 도구는 크게 국외와 국내로 나뉘어 국외의 경우 영국의 정성적 위험분석 방법론의 대표적 도구인 CRAMM, 미국의 정량적 위험분석 방법론 도구인 BDSS, 그리고 네트워크 위험분석 중심의 Expert와 같은 어플리케이션이 개발/활용 되고 있다. 한편, 국내 위험분석 자동화 도구로는 한국전산원에서 국내 최초로 개발한 위험분석 자동화 도구인 HAWK와 KAIST/펜타 시스템이 있다. 연구에서는 기존의 국내외 위험분석 방법론들의 비교분석 결과를 바탕으로, 실용적인 위험분석 방법론을제안하고 실용적으로 위험분석을 수행하기 위한 구체적인 도구를 개발하고 구현하였다. 세부적으로 위험분석 수행의 절차와 개념적 모형화에 대한 내용을 포함하여 표준적 틀을 유지하면서 현재 국내의 실무에 적합하며 간결한 위험분석 도구를 제시하였다.

  • PDF