• 제목/요약/키워드: 초점어

검색결과 120건 처리시간 0.021초

일한 문형사전을 위한 구문연구 (Study of Japanese Korean Syntactic Dictionary Construction)

  • 송영빈;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1998년도 제10회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.295-303
    • /
    • 1998
  • 이 논문은 한국어와 일본어의 대역문형사전 구축 시에 동사의 대역어 선정을 위한 구체적인 방법을 실증적으로 제시하는데 목적이 있다. 현재 자연언어 처리에서의 동사의 의미기술은 동사의 중의성(重義性)을 해소하려는데 초점이 맞추어져 있다. 그 주된 방법론은 동사와 결합하는 명사 의미속성의 기술에 의해 중의성을 해소하려는 것이다. 이 논문에서는 개별언어에 있어서의 명사의 의미속성의 분류가 다국어를 대상으로 하는 경우 어떻게 다루어져야 하는가에 대해 언어학적인 조명을 하는데 목적이 있다. 아울러 현재까지 일본에서 구축된 동사의 의미사전 들을 비교, 명사 의미속성 분류의 기준이 어떻게 설정되어야 하는가에 대해 검증한다. 특히 외국어와의 대조는 동사와 명사의 공기관계가 각 언어마다 독특한 결합관계를 갖으며 문법체계의 차이로 인해 개별언어를 대상으로 했을 때보다 의미기술의 양상이 상당히 달라짐을 보여줄 것이다.

  • PDF

의식론: 의식의 언어와 사고 전개 기능 (A Theory of Consciousness: Deployment of Language and Thought)

  • 김병원
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2002년도 춘계학술대회
    • /
    • pp.145-150
    • /
    • 2002
  • 의도와 관심의 실현을 위하여, 언어 행동을 주도하는 '의식'이 사고와 언어를 연결할 때에 드러내는 특성과 기능 일부를 밝히기 위해, <실용 논리> 수업 시간에 녹화한 한 대학생의 토론 첫 부분 내용을 Chafe의 '억양 단위' 분석법에 따라 분석한 결과, 억양의 단위는 평균 1.8초, 9.5음절로 구성되며, 언어와 사고는, 물처럼 흐르는 것이 아니라, 억양 단위로 끈어진 토막들이 의식에 의해 연결되면서 '관심점'의 내용이 전개되고 있는 것임을 발견하였다. 각 억양 단위 속에는 뚜렷하게 발음하는 하나 정도의 '초점'과, 그렇지 않은'주변' 내용과 형식으로 구성됨을 확인하고, 초점들을 서로 이으면 결국, 이어진 말 중심 내용이 드러남도 발견하였다. 한국어와 일본어 억양 단위는 주어+동사 형식을 갖추지 않은 예가 60%와 67.4%이므로, 주어+동사 모형은 언어와 사고 전개 모형의 한 예에 불과하다고 해석한다. 각 단위들의 연결 면에는 문제가 있음도 발견하였다.

  • PDF

에세이의 창의성 분류를 위한 어텐션과 역문서 빈도 기반의 자기부호화기 모델 (An AutoEncoder Model based on Attention and Inverse Document Frequency for Classification of Creativity in Essay)

  • 정세진;김덕기;온병원
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.624-629
    • /
    • 2022
  • 에세이의 창의성을 자동으로 분류하는 기존의 주요 연구는 말뭉치에서 빈번하게 등장하지 않는 단어에 초점을 맞추어 기계학습을 수행한다. 그러나 이러한 연구는 에세이의 주제와 상관없이 단순히 참신한 단어가 많아 창의적으로 분류되는 문제점이 발생한다. 본 논문에서는 어텐션(Attention)과 역문서 빈도(Inverse Document Frequency; IDF)를 이용하여 에세이 내용 전달에 있어 중요하면서 참신한 단어에 높은 가중치를 두는 문맥 벡터를 구하고, 자기부호화기(AutoEncoder) 모델을 사용하여 문맥 벡터들로부터 창의적인 에세이와 창의적이지 않은 에세이의 특징 벡터를 추출한다. 그리고 시험 단계에서 새로운 에세이의 특징 벡터와 비교하여 그 에세이가 창의적인지 아닌지 분류하는 딥러닝 모델을 제안한다. 실험 결과에 따르면 제안 방안은 기존 방안에 비해 높은 정확도를 보인다. 구체적으로 제안 방안의 평균 정확도는 92%였고 기존의 주요 방안보다 9%의 정확도 향상을 보였다.

  • PDF

Glossary에 기초한 시스템에서의 적형태 영어문장 생성을 위한 한영 대역에 전자사전구축 (Constructing A Korean-English Bilingual Dictionary For Well-formed English Sentence Generations In A Glossary-based System)

  • 신효필
    • 인지과학
    • /
    • 제14권2호
    • /
    • pp.1-13
    • /
    • 2003
  • 본 논문은 자연언어처리 (Natural Language Processing), 특히 한영 기계번역에서 필수적 인 한영 대역어 사전을 구축함에 있어 영어 생성시 정확한 문장형태를 도출하기 위한 방법에 대해 논의한다. 기간의 연구는 주로 한국어와 영어의 의미적 모호성이 해결된 정확한 번역을 위한 대역어 내지 변환사전 구조에 초점이 맞추어져 왔고 상대적으로 형태적 또는 구문적으로 정확한 영어문장을 생성하는 것은 간과되어져 왔다. 기존 자원의 황용이라는 측면에서는 텍스트화된 한영사전을 그대로 이용한다고 하면 그 기술방식과 영어표현은 다양한 형태로 나타나기 때문에 정확한 의미의 대역어 뿐만 아니라 적격한 영어문장의 생성을 위해서는 어떠한 정보들이 대역어 사전에 기술되어야 하는지 고려해 볼 필요가 있다 따라서 본 논의에서는 기존의 인쇄된 한영사전을 구조분석하여 자동으로 변환하여 최소한의 인간의 간섭으로 정확한 영어생성에 필요한 형태적 정보를 자질로 부여하는 방법을 기술한다. 기본적으로 이 방법은 단어 대 단어 번역시스템 둥 glossary에 기초한 얕은 층위의 번역이 필요한 시스템을 위한 사전을 구축에서 시작하며 더 나아가 대규모의 전자사전 구축작업에서 어떻게 응용될 수 있는지 논의한다.

  • PDF

의사 형태소 단위의 음성언어 형태소 해석 (Morphological Analysis of Spoken Korean Based on Pseudo-Morphemes)

  • 이경님;정민화
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1998년도 제10회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.396-404
    • /
    • 1998
  • 본 논문에서는 언어학적 단위인 형태소의 특성을 유지하면서 음성인식 과정에 적합한 분리 기준의 새로운 디코딩 단위인 의사형태소(Pseudo-Morpheme)를 정의 하였다. 이러한 필요성을 확인하기 위해 새로이 정의된 40개의 품사 태그를 갖는 의사 형태소를 표제어 단위로 삼아 발음사전 생성과 형태소 해석에 초점을 두고 한국어 연속음성 인식 시스템을 구성하였다.

  • PDF

해선어 양식업이 첨단산업으로 가는 길

  • 조세영
    • 한국양식학회:학술대회논문집
    • /
    • 한국양식학회 2003년도 추계학술발표대회 논문요약집
    • /
    • pp.15-16
    • /
    • 2003
  • 이제 바다로부터 식량을 얻는 방법이 어선을 통해 포획하는데서 점점 연근해에서 양식을 통해 생산하는 쪽으로 선회를 하는 것이 세계적인 추세가 되어가고 있다. 이와 같은 양식업의 점진적 발전은 해수 환경을 보전하고 생산 비용을 절감할 수 있는 새로운 형태의 먹이(사료)를 요구하고 있다. 그러나 물고기의 먹이로 적합한 어분 및 잡어의 생산과 공급은 해마다 어족 자원의 고갈로 감소되고 있다. 이런 가운데 양식어종의 사료로 어분이나 잡어를 대체할 수 있는 단백질 공급원을 개발하고 활용하는 연구가 활발히 진행되고 있다. 역사적으로 대두는 약 5000년 전 중국에서 재배되기 시작했다. 사람들은 본격적으로 19세기 초부터 대두에 대한 연구를 시작하여 대두가 사람에게 중요한 단백질과 기름을 제공할 수 있다는 것을 깨달았다. 1950년대 초반에 이르러 대두박이 값싸지만 단백질이 풍부한 사료원료로서의 가치가 입증되면서, 축산업이 오늘의 전성기를 구가할 수 있는 계기가 마련되었다. 그렇지만 바다에서 식량을 생산하는데 있어서도 육지에서 가장 많이 재배되는 두류작물인 대두와 대두제품을 활용하기 시작한 것은 먼 오래전의 일이 아니다. 우리나라뿐만 아니라 세계 여러 나라에서도 담수어종인 잉어, 뱀장어 및 틸라피아등에서 대두박의 영양학적 우수성이나 경제성이 이미 입증된 바 있다. 앞으로 해산어 양식기술의 발달은 해산어용 전문 배합사료의 개발과 보급 없이는 불가능하기 때문에, 미국, 일본, 노르웨이등 해산어 양식 선진국들일수록 이 부문에 대한 연구 개발 노력이 특히 활발하다. 식생활은 물론이고 심지어는 친환경적 산업 제품에 이르기까지 대두와 대두제품이 우리의 각광을 받고 있는 것은 결코 콩이 지닌 물리적 성상, 영양학적 및 경제적 가치의 우수성 때문만은 아니다. 미국은 자국의 대두 생산자들이 생산해 낸 대두를 판매하면서 조성한 자조금을 모아 대두의 생산성을 향상시키기 위한 연구 개발과 국내외 시장을 확대하기 위한 마케팅 활동에 쓰고 있다. 이런 자조 노력은 비단 미국의 대두 농민들에게만 국한된 것이 아니다. 가깝게는 일본의 수산업과 해산어 양식산업의 발전은 중앙 및 지방 정부, 수협과 같은 어민 조합 및 연근해 수산업 종사자들이 출연한 기금을 통해 이루어지고 있음을 지난 8월 북해도의 양식산업을 시찰했을 때 확인할 수 있었던 사실이다. 이제 우리나라도 국민소득 1만불 시대를 넘어 2만불 시대를 열기 위한 청사진을 그릴 만큼 모든 경제의 규모가 확대되었을 뿐 아니라 질적으로 고도화되었다. 우리에게 필요한 것은 성숙된 산업사회에 걸맞는 각 산업 주체들의 의식이다. 한국의 양식산업도 자조 정신을 갖추어 생산성 향상에 초점을 맞춘 양식기술의 개발, 환경 보전을 고려한 양식장 관리 및 소비를 확대하기 위한 유통시스템의 선진화에 스스로 투자를 해야 할 시기에 와 있다.

  • PDF

문서 특성에 대한 선호도 기반 웹 검색 개인화 (Web Search Personalization based on Preferences for Page Features)

  • 이수정
    • 정보교육학회논문지
    • /
    • 제15권2호
    • /
    • pp.219-226
    • /
    • 2011
  • 웹 상에서 사용자가 원하는 정보를 효율적으로 검색하는데 도움을 주기 위하여 웹 개인화는 사용자에게 흥미있는 웹 문서들을 추출해내는데 초점을 두고 있다. 이를 실현하기 위한 주요 방법들 중 하나는 문서에 포함된 질의어, 링크 및 사용자의 선호어를 이용하는 것이다. 본 연구에서는 이들 요소 외에 사용자들이 웹문서를 선택할 때 중요하게 생각하는 문서 특성들을 설문을 통하여 조사하였다. 설문 결과 문서의 내용이 가장 중요한 특성이었으나, 일부 사용자들에게는 문서에 포함된 이미지와 가독성도 내용과 마찬가지로 중요하게 간주되었다. 이를 바탕으로 각 사용자를 위한 문서의 주요 특성들의 상대적 가중치를 프로필에 유지 관리하고, 검색 결과의 개인화에 반영하는 방안을 제시한다. 제안한 개인화 방법의 성능을 분석한 결과, 일반 검색 엔진에 비해 최대 약 2.3배의 성능 향상을 보였고, 사용자 질의어와 선호어를 모두 이용하여 검색 결과를 산출하는 방법보다 약 1.5배의 성능 향상을 나타내어 그 우수성을 입증하였다.

  • PDF

한국어 서술어와 지식베이스 프로퍼티 연결 (Linking Korean Predicates to Knowledge Base Properties)

  • 원유성;우종성;김지성;함영균;최기선
    • 정보과학회 논문지
    • /
    • 제42권12호
    • /
    • pp.1568-1574
    • /
    • 2015
  • 본 논문은 자연언어 문장을 지식베이스의 지식 골격에 맞추어 지식의 형태로 변환하기 위한 과정 중의 하나인 관계추출(Relation Extraction)을 목표로 한다. 특히, 문장 내에 있는 서술어(Predicate)에 집중하여 서술어와 관련성 높은 지식베이스 프로퍼티(Property or Relation)를 찾아내고, 이를 통해 두 개체(Entity)간의 의미를 파악하는 관계추출에 초점을 둔다. 이에 널리 활용되는 원격지도학습(Distant Supervision) 접근 방식에 따라, 지식베이스와 자연언어 텍스트로부터 원격 학습이 가능한 레이블(Labeled) 데이터를 자동으로 마련하여 지식베이스 프로퍼티에 대한 어휘화 작업을 수행한다. 즉, 두 개체 사이의 관계로 표현되는 서술어와, 온톨로지로 정의할 수 있는 프로퍼티와의 연결을 통해, 텍스트로부터 구조적 정보를 생성할 수 있는 기반을 마련하고 최종적으로 지식베이스 확장의 가능성을 열어준다.

한국어 자연어 요구문서에서 구문 구조 기반의 조응어 처리 시스템 (Anaphora Resolution System for Natural Language Requirements Document in Korean based on Syntactic Structure)

  • 박기선;안동언;이용석
    • 정보처리학회논문지B
    • /
    • 제17B권3호
    • /
    • pp.255-262
    • /
    • 2010
  • 시스템 개발에 있어서 요구문서(requirements document)를 생성하고 정형 명세를 작성하는 것은 요구 분석 전문가와 명세 전문가에 의해 수행되고 있다. 만약 요구문서 생성과 정형 명세 작성 과정을 자동화 한다면 시스템 개발 비용 및 기간을 단축할 수 있고, 또한 전문가 사이의 잘못된 이해로 인한 오류를 줄일 수 있다. 대명사는 인칭대명사와 지시대명사로 분류될 수 있다. 일반적으로 요구문서의 특성상 인칭대명사는 사용되지 않기 때문에 본 논문은 지시대명사의 지시어 결정에 초점을 두고 있다. 지시대명사를 포함하는 요구문서에서 자연어처리 기법을 통해 정형화된 요구사항을 자동으로 추출하기 위해서는 대명사의 지시어 결정이 매우 중요하다. 본 연구의 최종 목표는 자연어 처리 기법을 통하여 자연어 요구문서로부터 시스템 개발에 필요한 정형 명세를 자동으로 생성하는데 있다. 이를 위해 본 논문은 선행연구를 기반으로 한국어로 기술된 자연어 요구문서에서 대명사에 대한 지시어를 결정하는 조응어 해소(anaphora resolution) 시스템을 제안한다. 본 시스템의 개발을 위해 조응어 해소를 위한 경험 규칙을 정의하고, 이를 통해 10개의 요구문서에 대해 실험한 결과 평균 재현율 92.45%, 정확률 69.68%의 성능을 보였다.

한국인 영어학습자의 명사구 발화에서 영어 능숙도에 따른 관사와 단음절 명사 모음 길이 비교 (Comparison of vowel lengths of articles and monosyllabic nouns in Korean EFL learners' noun phrase production in relation to their English proficiency)

  • 박우지;모란;이석재
    • 말소리와 음성과학
    • /
    • 제12권3호
    • /
    • pp.33-40
    • /
    • 2020
  • 본 연구는 기능어인 관사 및 1음절 내용어 명사로 구성된 명사구 내 두 단어의 모음 길이 비율과 영어 능숙도 사이의 상관관계를 밝히는 데 목적이 있다. 영어와 한국어 발음에 있어서 대표적 차이 중 하나는 발음상의 리듬이라는 특정적인 요소가 규칙적으로 나타나는지 여부이다. 특히 영어 발화시 내용어는 기능어 대비 상대적으로 더 두드러진(prominent) 소리를 가지게 되는데 이는 영어에서 내용어의 경우 강세를 갖게 되나 기능어의 경우 그 강세가 미비하거나 강세를 갖지 않기 때문이다. 따라서 영어의 내용어 단어 내 모음은 기능어 단어의 모음보다 길게 발음되며, 더 큰 소리로 발화되며, 더 높은 소리를 가지고 리듬을 만들어 내게 된다. 이를 근거로 본 연구에서는 내용어 내 강세를 갖는 모음과 기능어 내 강세를 갖지 않는 모음의 길이 차이에 초점을 두고 유창성이 평가된 L2 영어 음성 코퍼스(Rated K-SEC) 중 한국인 초등학생이 발화한 879(원어민 발화 20개 포함)개의 문장 내 명사구 음성 파일을 연구자료로 사용하였다. 이 879개의 문장은 영어 유창성 평가에 따라 4개의 등급으로 각각 재분류되었으며 이들 문장안에 들어 있는 명사구 내의 관사의 모음 길이와 명사의 모음 길이를 확인하고 그 비율을 측정하였다. 분석 결과 관사 모음 대비 명사 모음 길이 비율은 영어 능숙도와 양의 상관관계를 갖는 것을 확인하였다[Advanced(2.453)>Intermediate High(1.26)>Intermediate Low(1.034)>Novice(0.857)]. 또한 각 능숙도 그룹 간 내용어-기능어 간 모음 길이의 차이 및 그 비율의 차이가 통계적으로 유의미한 것으로 나타났다(p< .001). 이는 한국인 화자의 경우 영어 유창성이 높아질수록 영어 단어 발화 시 명사구 내의 기능어인 관사 모음보다 내용어인 명사 모음을 통계적으로 유의하게 더 길게 발화한다는 것을 의미한다.