• 제목/요약/키워드: 연어 패턴

검색결과 7건 처리시간 0.028초

연어 관계 분석을 통한 Java API 패턴 추출 및 추천 방법 (Java API Pattern Extraction and Recommendation using Collocation Analysis)

  • 권찬우;황상원;남영광
    • 정보과학회 논문지
    • /
    • 제44권11호
    • /
    • pp.1165-1177
    • /
    • 2017
  • 소프트웨어 개발 진행 시 개발자는 다양한 방법으로 API의 사용 방법을 검색하지만, 원하는 검색 결과를 얻지 못하는 경우가 많다. 이러한 문제를 해결하기 위해, 본 연구에서는 추상구문트리의 연어 관계를 이용하여 API 패턴을 추출하고 이를 추천하는 시스템 JACE(Java AST Collocation-pattern Extractor)를 개발하였다. JACE는 자바 추상구문트리를 분석하여 API 호출 노드를 추출한 후, 노드 간 연어 관계를 분석하고 연어 관계 사전을 구축한다. 구축된 연어 관계 사전을 이용하여 연어 관계 리스트를 생성하고 이것을 패턴으로 정의한다. 정의된 패턴은 이클립스 플러그인으로 제작된 테스트 프로그램을 통하여 사용자 요청 시 추천된다. 실험을 위해 794개의 오픈소스 프로젝트를 분석하였고, 약 1천 5백만개의 API 호출 노드를 추출하여 실험하였다. 결과적으로, 기존 검색 시스템들보다 더 유용한 예제 코드 및 사용법을 제시하였다.

세종 말뭉치로부터 용언연어 추출 (Verbal Collocation Extraction from Sejong Tagged Corpus)

  • 이정태;천민아;김재훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2015년도 제27회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.121-123
    • /
    • 2015
  • 연어는 둘 이상의 단어로 구성된 표현으로 연어에 속하는 개개의 단어의 의미로써 연어의 의미를 유추할 수 없다. 따라서 연어의 의미를 분석하거나 번역할 경우 개개의 단어보다는 연어 그 자체를 하나의 분석 단위로 간주하는 것이 훨씬 더 효과적이다. 이를 위해 본 논문에서는 통계기법을 활용하여 세종 말뭉치로 부터 용언연어의 추출 방법을 제시하고 그 성능을 평가한다. 연어 패턴과 통계 정보를 이용해서 연어를 추출한다. 평가를 위해서 연어 사전과 전문가의 주관적 평가를 동시에 수행했다.

  • PDF

하위범주화 사전의 구축 및 자동 확장 (Development and Automatic Extraction of Subcategorization Dictionary)

  • 이수선;박현재;우요섭
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (2)
    • /
    • pp.179-181
    • /
    • 2000
  • 한국어의 통사적, 의미적 중의성 해결을 위해 하위범주화 사전을 구축하였다. 용언에 따라 제한될 수 있는 문형 패턴과 의미역(semantic roles) 정보의 표준을 정하여 이를 부가하였고 구축한 하위범주화 사전이 명사에 대한 의미를 갖고 있는 계층 시소러스 의미사전과 연동하도록 용언과 명사와의 의미적 연어 관계에 따라 의미마커를 부여했다. 논문에서 구현된 하위범주화 사전이 구문과 어휘의 중의성을 어느 정도 해소하는지 확인하기 위해 반자동적으로 의미 태깅(Sense Tagging)된 말뭉치와 구문분석된 말뭉치를 통해 검증 작업을 수행했다. 이 과정에서 자동으로 하위범주 패턴에 대한 빈도 정보나, 연어정보, 각 의미역과 용언의 통계적 공기 정보 등을 추출하여 하위범주화사전에 추가시켰다. 또한 여기서 얻은 정보를 기준으로 하위범주화 사전을 자동으로 확장하는 알고리즘을 적용하여 확장시켰다.

  • PDF

온도와 시간을 주요 변수로한 훈제연어에서의 Listeria monocytogenes 성장예측모델 (Predictive mathematical model for the growth kinetics of Listeria monocytogenes on smoked salmon)

  • 조준일;이순호;임지수;곽효선;황인규
    • 한국식품위생안전성학회지
    • /
    • 제26권2호
    • /
    • pp.120-124
    • /
    • 2011
  • 훈제연어의 L. monocytogenes에 대한 식중독 안전관리 방안 마련 및 위해평가 수행 등을 위하여 성장예측모텔을 개발하였다. 미생물 성장예측모델 개발 방법은 대상 식품 및 환경 조건에 따라 다양하며 통계적으로 유용한 모델을 사용하여야 하기에 본 연구에서는 미생물 성장예측모델 개발에 널리 사용되어 그 적용성이 검토된 Gompertz model과 Polynomial model equation을 이용하여 훈제연어의 L. monocytogenes 최대성장속도(SGR) 및 유도기(LT)에 관한 예측모텔을 개발하였다. 개발된 모델의 적합성 평가를 위해 $B_f$$A_f$ factor를 산출하였고 최대성장속도(SGR)의 경우 0.98, 1.06, 유도기(LT)의 경우 1.60, 1.63으로 나타나 유도기의 적합성이 최대성장속도에 비하여 떨어지는 것으로 확인되었다. 본 연구에서 개발된 훈제연어에서의 L. monocytogenes 성장속도에 관한 모텔은, 수산업, 특히 훈제연어 생산, 가공, 보관 및 판매업에 다양한 방면으로 활용 가능할 것으로 판단되며, 더욱 정확한 예측모텔 개발을 위해서는 다양한 변수에 따른 미생물의 성장패턴 변화 등에 관한 연구가 추가적으로 시행되어야 할 것으로 생각되어 진다.

한국어 분석의 중의성 해소를 위한 하위범주화 사전 구축 (Development of Subcategorization Dictionary for the Disambiguation Korean Language Analysis)

  • 이수선;박현재;우요섭
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1999년도 제11회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.257-264
    • /
    • 1999
  • 자연언어 처리에 있어 문장의 성분 구조를 파악하는 통사적 해석에서는 애매성 있는 결과가 많이 생성된다. 한국어의 경우 어순 등의 통사적 특성뿐 아니라 상황과 의미, 문맥이 문장의 분석에 더 중요한 역할을 하기 때문에 문맥 자유 문법에 의한 접근 방법만으로는 중의적 구조의 해결이 어렵다. 이는 또한 의미 분석시 애매성을 증가시키는 원인이 된다. 이러한 통사적, 의미적 중의성 해결을 위해 용언 중심의 하위범주화 사전을 구축하였다. 본 논문에서는 용언에 따라 제한될 수 있는 하위범주 패턴을 정의하고 패턴에 따라 하위범주 사전을 구축하였다. 하위범주화 사전에는 명사의 시소러스와 정합하여 보어를 선택 제한(Selectional Restriction)할 수 있도록 용언과 명사와의 의미적 연어 관계에 따라 의미마커를 부여했다. 말뭉치를 통해 수집된 용언 12,000여개를 대상으로 25,000여개의 하위범주 패턴을 구축하였고 이렇게 구축한 하위범주화 사전이 120,000여 명사에 대한 의미를 갖고 있는 계층 시소러스 의미 사전과 연동하도록 하였다. 또한 논문에서 구현된 하위범주화 사전이 구문과 어휘의 중의성을 어느 정도 해소하는지 확인하기 위해 반자동적으로 의미 태깅(Sense Tagging)된 2만여 문장의 말뭉치를 통해 검증 작업을 수행하고, 의존관계와 어휘의 의미를 포함하고 있는 말뭉치에 하위범주 패턴이 어느정도 정합되는지를 분석하여, 하위범주 패턴과 말뭉치의 의존관계만 일치하는 경우와 어휘의 의미까지 일치하는 경우에 대해 평가한다. 이 과정에서 하위범주 패턴에 대한 빈도 정보나, 연어 정보를 수집하여 데이터베이스에 포함시키고, 각 의미역과 용언의 통계적 공기 정보 등을 추출하는 방법도 제시하고자 한다.을 입증하였다.적응에 문제점을 가지기도 하였다. 본 연구에서는 그 동안 계속되어 온 한글과 한잔의 사용에 관한 논쟁을 언어심리학적인 연구 방법을 통해 조사하였다. 즉, 글을 읽는 속도, 글의 의미를 얼마나 정확하게 이해했는지, 어느 것이 더 기억에 오래 남는지를 측정하여 어느 쪽의 입장이 옮은 지를 판단하는 것이다. 실험 결과는 문장을 읽는 시간에서는 한글 전용문인 경우에 월등히 빨랐다. 그러나. 내용에 대한 기억 검사에서는 국한 혼용 조건에서 더 우수하였다. 반면에, 이해력 검사에서는 천장 효과(Ceiling effect)로 두 조건간에 차이가 없었다. 따라서, 본 실험 결과에 따르면, 글의 읽기 속도가 중요한 문서에서는 한글 전용이 좋은 반면에 글의 내용 기억이 강조되는 경우에는 한자를 혼용하는 것이 더 효율적이다.이 높은 활성을 보였다. 7. 이상을 종합하여 볼 때 고구마 끝순에는 페놀화합물이 다량 함유되어 있어 높은 항산화 활성을 가지며, 아질산염소거능 및 ACE저해활성과 같은 생리적 효과도 높아 기능성 채소로 이용하기에 충분한 가치가 있다고 판단된다.등의 관련 질환의 예방, 치료용 의약품 개발과 기능성 식품에 효과적으로 이용될 수 있음을 시사한다.tall fescue 23%, Kentucky bluegrass 6%, perennial ryegrass 8%) 및 white clover 23%를 유지하였다. 이상의 결과를 종합할 때, 초종과 파종비율에 따른 혼파초지의 건물수량과 사료가치의 차이를 확인할 수 있었으며, 레드 클로버 + 혼파 초지가 건물수량과 사료가치를 높이는데 효과적이었다.\ell}$ 이었으며 , yeast extract 첨가(添加)하여 배양시(培養時)는 yeast extract

  • PDF

일반화된 미등록어 처리와 오류 수정규칙을 이용한 혼합형 품사태깅 (Hybrid POS Tagging with generalized unknown word handling and post error-correction rules)

  • 차정원;이원일;이근배;이종혁
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1997년도 제9회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.88-93
    • /
    • 1997
  • 본 논문에서는 품사 태깅을 위해 여러 통계 모델을 실험을 통하여 비교하였으며 이를 토대로 통계적 모델을 구성하였다. 형태소 패턴 사전을 이용하여 미등록어의 위치와 개수에 관계없는 일반적인 방법의 미등록어 처리 방법을 개발하고 통계모델이 가지는 단점을 보완할 수 있는 오류 수정 규칙을 함께 이용하여 혼합형 품사 태깅 시스템인 $POSTAG^{i}$를 개발하였다. 미등록어를 추정하는 형태소 패턴 사전은 한국어 음절 정보와 용언의 불규칙 정보를 이용하여 구성하고 다어절어 사전을 이용하여 여러 어절에 걸쳐 나타나는 연어를 효과적으로 처리하면서 전체적인 태깅 정확도를 개선할 수 있다. 또 오류 수정 규칙은 Brill이 제안한 학습을 통하여 자동으로 얻어진다. 오류 수정 규칙의 자동 추출시에 몇 가지의 휴리스틱을 사용하여 보다 우수하고 일반적인 규clr을 추출할 수 있게 하였다. 10만의 형태소 품사 말뭉치로 학습하고 학습에 참여하지 않은 2만 5천여 형태소로 실험하여 97.28%의 정확도를 보였다.

  • PDF

Denaturing gradient gel electrophoresis와 real time PCR 방법을 이용한 연어 유전자들의 DNA 이형 다양성 검색 (DNA Heteropolymorphism of Chum Salmon Detected by Denaturing Gradient Gel Electrophoresis and Real Time PCR)

  • 함승협;이석근;한현섭;진덕희
    • 한국수산과학회지
    • /
    • 제35권5호
    • /
    • pp.490-496
    • /
    • 2002
  • 한국, 미국, 일본지역에 서식하는 연어에서 추출한 genomic DNA를 이용하여 연어의 mtDNA NDI 영역, D-loop 영역, growth hormone, IGF-I, MCH2, histone H3의 염기서열을 분석하여, 최적의 primer를 제작하여 PCR을 실시한 결과, mtDNA NDI 영역은 Ks12, Ks24, As11, As14, Js13, Js15에서 증폭된 DNA를 확인하였으며, D-loop 영역, growth hormone, IGF-I, histone H3, MCH2에서는 모든 시료에서 증폭된 DNA를 확인하였다. DGGE 분석의 결과, mtDNA NDI 영역 (AF133701, 449-880), D-loop 영역 (AF125518, 11-514)과 growth hormone (AFO05927, 181-530)에서는 이형다양성을 확인하였으며, IGF-I (AF063216, 962-1461)과 MCH2 (M27281, 70-593)는 모두 이형다양성이 나타났으나, histone H3 (AF017147, 7-487)는 모두 이형다양성이 관찰되지 않았다. 그리고 real time PCR 관찰 결과는 DGGE의 결과와 유사한 점을 찾을 수 없었지만, real time PCR도 각각의 유전자에 따라 서로 다른 DNA 생성 패턴을 보여 DNA 변이를 쉽게 구별하는데 보조적인 도움이 되었다.