• 제목/요약/키워드: 패

검색결과 512건 처리시간 0.026초

패러프레이즈 추출을 위한 키프레이즈 데이터셋 구축 방법론 연구 (A Study on the Construction of keyphrase dataset for paraphrase extraction)

  • 강혜린;강예지;박서윤;장연지;김한샘
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.357-362
    • /
    • 2020
  • 자연어 처리 응용 시스템이 패러프레이즈 표현을 얼마나 정확하게 포착하는가에 따라 응용 시스템의 성능 측면에서 차이가 난다. 따라서 자연어 처리의 응용 분야 전반에서 패러프레이즈 표현에 대한 중요성이 커지고 있다. 시스템의 성능 향상을 위해서는 모델을 학습시킬 충분한 말뭉치가 필요하다. 특히 이러한 패러프레이즈 말뭉치를 구축하기 위해서는 정확한 패러프레이즈 추출이 필수적이다. 따라서 본 연구에서는 패러프레이즈를 추출을 위한 언어 자원으로 키프레이즈 데이터셋을 제안하고 이를 기반으로 유사한 의미를 전달하는 패러프레이즈 관계의 문장을 추출하였다. 구축한 키프레이즈 데이터셋을 패러프레이즈 추출에 활용한다면 본 연구에서 수행한 것과 같은 간단한 방법으로 패러프레이즈 관계에 있는 문장을 찾을 수 있다는 것을 보였다.

  • PDF

문장 유사도를 이용한 다양한 표현의 패러프레이즈 생성 (Various Paraphrase Generation Using Sentence Similarity)

  • 박다솔;장두성;차정원
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.576-581
    • /
    • 2021
  • 패러프레이즈란 어떤 문장을 같은 의미를 가지는 다른 단어들을 사용하여 표현한 것들을 의미한다. 이는 정보 검색, 다중 문서 요약, 질의응답 등 여러 자연어 처리 분야에서 중요한 역할을 한다. 특히, 양질의 패러프레이즈 코퍼스를 얻는 것은 많은 시간 및 비용이 소요된다. 이러한 문제점을 해소하기 위해 본 논문에서는 문장 유사도를 이용한 패러프레이즈 쌍을 구축하고, 또 구축한 패러프레이즈 쌍을 이용하여 기계 학습을 통해 새로운 패러프레이즈을 생성한다. 제안 방식으로 생성된 패러프레이즈 쌍은 기존의 구축되어 있는 코퍼스 내 나타나는 표현들로만 구성된 페러프레이즈 쌍이라는 단점이 존재한다. 이러한 단점을 해소하기 위해 기계 학습을 이용한 실험을 진행하여 새로운 표현에 대한 후보군을 추출하는 방법을 적용하여 새로운 표현이라고 볼 수 있는 후보군들을 추출하여 기존의 코퍼스 내 새로운 표현들이 생성된 것을 확인할 수 있었다.

  • PDF

시맨틱 프레임을 이용한 한국어 패러프레이즈 자동 평가 방법 (An Automatic Evaluation Metric for Korean Paraphrase via Semantic Frame)

  • 박한철;권가진;최호진
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 춘계학술발표대회
    • /
    • pp.761-764
    • /
    • 2014
  • 본 연구는 지능형 QA시스템과 관련한 연구에서, 자동 패러프레이즈 생성 시스템을 평가하는 새로운 방법을 제시한다. 기존의 패러프레이즈 생성 시스템의 자동 평가 방법은 참조할 수 있는 패러프레이즈 정보의 양이 크게 제한되어 있었으며, 원 문장의 콘텍스트(context)와 이에 의존하는 통사적 구조(syntactic structure) 및 의미적 구조의 유사성을 고려하지 않고, 단순 구/단어 수준의 의미 유사성을 기반으로 생성된 패러프레이즈를 평가하였다. 이러한 문제를 해결하기 위해 본 연구는 시맨틱 프레임(semantic frame)을 이용한 패러프레이즈 문장 평가 방법을 제시한다. 본 연구에서 제시하는 방법론은 문장의 콘텍스트를 표현하는 프레임과 이러한 프레임이 발생시키는 통사적, 의미적 구조의 유사성을 바탕으로 원 문장과 패러프레이즈 문장의 '의미 유사성', '어휘 형태 비 유사성'을 평가하는 방식이다.

확률론에 근거한 정통 마작의 패 평가 알고리즘 (A Tile Evaluating Algorithm for Orthodoxy Mahjong Based on a Probability Theory)

  • 김상진
    • 한국콘텐츠학회논문지
    • /
    • 제6권2호
    • /
    • pp.154-161
    • /
    • 2006
  • 본 논문을 통해 정통마작 게임 중의 자신이 가진 각 패의 값어치를 평가하기 위한 확률적인 방법을 소개한다. 마작은 현재 지구상에서 가장 인기 있는 보드게임의 하나이다. 마작게임에 있어서 가장 중요한 기술은 자신이 가진 패들 중 가장 값어치가 적은 패를 골라 버리는 방법이다. 소유한 각 패의 중요도를 구하기 위하여 먼저 각 패를 중복 사용하여 구성 가능한 모든 조를 생성한다. 이들 중 소유한 패로 구성 가능한 조 조합의 후보들을 구한다. 마지막으로 이들 후보 중 가장 유리한 후보를 택하고 이 후보를 구성하는데 사용된 조와 각 패의 조구성에 사용된 유용성을 감안하여 패를 평가한다.

  • PDF

제어가능한 한국어 패러프레이즈 생성을 위한 제약들 (Constraints for Controllable Korean Paraphrase Generation)

  • 최승권;권오욱;김영길
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 추계학술발표대회
    • /
    • pp.544-546
    • /
    • 2022
  • 언어학적 다양성을 가지는 고품질의 한국어 패러프레이즈 생성을 위해 패러프레이즈의 생성을 제어할 수 있는 제약이 필요하다. 원문을 패러프레이즈로 변경하기 위한 생성용 제약으로 6 개의 제약을 제시한다: 키워드 치환, 키워드 확장, 품사 변경, 패턴 변경, 구조 변경, 키워드 리스트, 생성 길이. 원문으로부터 패러프레이즈를 생성할 때 제약이 적용되는 정도를 시물레이션해 보았다. 10 어절 이하의 원문은 평균 2.05 번의 제약이 적용되면 패러프레이즈가 생성되었으며 키워드 치환, 마스킹에 의한 키워드 확장과 패턴 변경에 관한 제약이 가장 많이 적용되는 것을 확인하였다.

피봇 가중치 접근을 통한 한국어 패러프레이즈 추출 (Pivot Weighting Approach to Extract Korean Paraphrases)

  • 박에스더;이형규;김민정;임해창
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2010년도 제22회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.31-36
    • /
    • 2010
  • 이중 언어 병렬 말뭉치를 이용하는 패러프레이즈 추출 과정에서는 일반적으로 다른 언어를 피봇 언어로 하여 단어 및 구 정렬 과정을 두 번 거친다. 따라서 단어 정렬의 오류 전파 문제가 큰 단점이 된다. 특히 한국어와 영어와 같이 언어의 구조적인 차이가 큰 경우, 단어 정렬 오류가 더 많고 이로 인해 잘못된 피봇 프레이즈가 선정되는 문제가 더욱 심각하다. 이런 문제를 보완하기 위해, 본 논문에서는 패러프레이즈 추출 과정에서 피봇 프레이즈를 차별화하는 방안으로서, 올바른 피봇 프레이즈에 더 높은 가중치를 부여 하는 방법을 제안한다. 실험 결과, 기존의 패러프레이즈 추출 방법에 제안하는 피봇 가중치 부여 방법을 추가적으로 적용했을 때, 패러프레이즈 추출 정확률과 재현율이 모두 향상됨을 확인할 수 있었다.

  • PDF

이중 언어 기반 패러프레이즈 추출을 위한 피봇 차별화 방법 (Pivot Discrimination Approach for Paraphrase Extraction from Bilingual Corpus)

  • 박에스더;이형규;김민정;임해창
    • 인지과학
    • /
    • 제22권1호
    • /
    • pp.57-78
    • /
    • 2011
  • 패러프레이즈는 같은 의미를 다른 단어를 사용하여 표현한 것을 말한다. 패러프레이즈는 일상적인 언어생활에서도 흔히 관측되며 자연어처리 분야에서 다양하게 활용할 수 있다. 특히 최근에는 통계적 기계 번역 분야에서 데이터 부족 문제를 보완하여 번역 성능을 향상시키기 위해 패러프레이즈를 활용한 연구가 많다. 이중 언어 병렬 말뭉치를 이용하는 패러프레이즈 추출 과정에서는 일반적으로 다른 언어를 피봇으로 사용하기 때문에 단어 정렬 및 구 정렬 과정을 두 번 거친다. 따라서 단어 정렬의 오류가 패러프레이즈로 전파될 수 있다. 특히 한국어와 영어와 같이 언어의 구조적인 차이가 큰 경우에는 단어 정렬 오류가 더 심각하기 때문에 피봇 프레이즈부터 잘못 추출되는 경우가 많아진다. 이러한 문제를 보완하기 위해 본 논문에서는 패러프레이즈 추출 과정에서 피봇 프레이즈를 차별화하는 방안으로서 어휘, 품사 정보를 이용해 올바른 피봇 프레이즈에 더 높은 가중치를 부여하는 방법을 제안한다. 실험 결과, 제안하는 피봇 가중치 부여 방법을 기존의 패러프레이즈 추출 방법에 추가했을 때 패러프레이즈 추출 정확률과 재현율이 모두 향상됨을 확인할 수 있었다. 또한, 제안하는 방법을 통해 추출한 패러프레이즈를 한영 기계 번역 시스템에서 활용하였을 때 번역률이 향상됨을 확인할 수 있었다.

  • PDF

토양의 산도교정과 사과 생육에 대한 패화석 시용 효과 (Effect of Oyster Shell Powder on Soil pH and Growth and Yield of Apple)

  • 이성태;이영한;이영진;이춘희
    • 한국토양비료학회지
    • /
    • 제37권6호
    • /
    • pp.383-387
    • /
    • 2004
  • 농가에서 관리하는 9년생 후지품종의 사과 과수원에 패화석과 석회고토의 중화량를 시용하여 작물생육과 토양 화학성 변화를 조사한 결과는 다음과 같았다. 석회를 시용하지 않은 처리구의 토양은 시험전후 pH가 5.6으로 차이가 없었으나, 패화석과 석회고토 처리구에서는 Ca, Mg 함량이 증가되고 pH가 5.6에서 6.8로 높아져 패화석은 석회고토 처리구와 동등의 산도교정 효과가 있었다. 패화석과 석회고토 시용으로 사과나무 신초의 초장과 신초수, 신초경이 증가되었으며, 석회 무시용에 비해 간경과 주지경의 직경이 연간 0.7 및 1.0 mm 증가하였고, 부주지경의 증가는 패화석과 석회고토 시용이 각각 1.7 및 1.8 mm 증가하여 사과나무의 생육에 효과가 있는 것으로 나타났다. 패화석과 석회고토 처리로 시기별 엽록소함량은 차이가 없었으나 건물중 변화는 10월 23일 조사시 무시용27.3% 대비 패화석과 석회고토 시용이 각각 33.1 및 31.0%로서 높았다. 시기별 엽중 무기성분으로 질소함량은 무시용 대비 패화석과 석회고토 시용으로 함량이 증가하였으며, CaO 함량은 큰 차이가 없었고, Mn 함량이 높았다. 사과의 당도, 경도 및 산도에 대한 패화석 시용효과는 무처리와 비교해 차이가 나타나지 않았으며, 석회고토 처리시 경도는 석회 무시용에 비해 낮았다. 패화석 시용시 색도는 황색도가 약간 높았으나 적색도에서는 낮았으며, 선명도는 처리간 차이가 나타나지 않아 패화석 시용이 사과의 품질 향상에는 영향을 미치지 못하였고 수량은 $37,000kg\;ha^{-1}$로 무시용 대비 5% 증수되었다.

차세대 클라우드 컴퓨팅을 위한 패브릭 컴퓨팅 기술 (Fabric Computing for Next Generation Cloud Computing)

  • 이중수;안창원
    • 전자통신동향분석
    • /
    • 제28권1호
    • /
    • pp.1-8
    • /
    • 2013
  • 클라우드 컴퓨팅의 구현과 관리의 차세대 모델로 지목되는 패브릭 컴퓨팅은 오랜 컴퓨터 전문가들의 바람에도 불구하고 아직 구현 단계에 접근하지 못하였다. 그러나, 최근 패브릭 컴퓨팅에 대한 관심이 높아지고 이를 위한 초보적인 시도가 이루어지고 있다. 본고에서는 패브릭 컴퓨팅의 개념과 필요한 요소 기술, 관련 제품을 살펴보고 기술 발전 방향을 가늠하고자 한다.

  • PDF

입력 확장 스위치 패브릭을 고려한 입력 버퍼링 패킷 스위치 (An Input-Buffered Packet Switch with input expansion switch fabric)

  • 이현태
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 1998년도 춘계종합학술대회
    • /
    • pp.252-257
    • /
    • 1998
  • 본 논문은 입력 버퍼링 구조를 갖는 패킷 스위치에서 입력 확장 스위치 패브릭 구조를 통한 성능 개선에 관한 연구이다. 스위치 패브릭의 처리 능력 개선을 위한 다양한 구조에 대한 성능 및 설계 파라메터를 분석하고, 목적지별로 구분되는 입력 확장스위치 패브릭 구조를 제안하고 버스트 트래픽 환경에서 제안된 스위치의 성능을 분석한다.

  • PDF