• 제목/요약/키워드: 어휘정보

검색결과 1,062건 처리시간 0.03초

효과적인 영문 독해능력 향상을 위한 웹 기반 시스템 설계 및 구현 (Design and Implementation of Web based System for Improving of English Reading Ability)

  • 이원섭;이상희
    • 한국컴퓨터정보학회논문지
    • /
    • 제5권3호
    • /
    • pp.58-63
    • /
    • 2000
  • 그 동안의 인터넷을 이용한 실용영문독해 수업은 단순히 영어로 된 인터넷 홈 페이지를 찾아 독해하는 방식으로 이루어졌다. 이러한 교육 방법은 인터넷 자료의 방대함, 수업의 수준에 적합하지 않은 어휘사용, 인터넷 자료를 찾기까지의 컴퓨터 활용능력의 요구, 또한 독해 후 토론 및 발표의 방안 부족 등의 여러 가지 문제점을 갖고 있어 효과적인 수업을 진행하기 어려운 것인 현실이었다. 따라서 본 연구에서는 이러한 문제점을 체계적으로 파악하고 이를 해결할 수 있는 시스템을 설계 구현하였다.

  • PDF

부분표절구간 검출을 위한 질의문서의 분할 및 탐색 기법 (A Fragmentation and Search Method of Query Document for Partially Plagiarized Section Detection)

  • 옥창석;서종규;조환규
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 추계학술발표대회
    • /
    • pp.586-589
    • /
    • 2012
  • 표절과 관련된 이슈가 주목받고 있는 상황에서 표절을 검출하는 방법에 대한 연구가 활발히 진행되고 있다. 일반적으로 표절구간 검출을 위해 복잡한 자연어처리와 같은 의미론적 접근방법이 아닌 비교적 단순한 어휘기반의 문자열 처리 방법을 사용한다. 대표적인 방법으로는 지문법 (Fingerprinting)과 서열정렬 (Sequence alignment) 등이 있다. 하지만 이 방법들을 이용하여 대용량 문서에 대한 표절검사를 수행하기에는 시공간적 복잡도의 문제가 발생한다. 본 논문에서는 이러한 단점을 극복하기 위해 NGS (Next Generation Sequencing)에서 사용하는 BWT (Burrows-Wheeler Transform)[1]를 이용한 탐색방법을 응용한다. 또한 부분표절구간을 검출하고 정확도를 향상시키기 위해 질의문서를 분할하여 작은 조각으로 만든 뒤, 조각들에 대한 질의탐색을 수행한다. 본 논문에서는 질의문서를 분할하는 두 가지 방법을 소개한다. 두 가지 방법은 k-mer analysis를 이용한 방법과 random-split analysis를 이용한 방법으로, 각 방법의 장단점을 실험을 통해 분석하고 실제 부분표절구간의 검출 정확도를 측정하였다.

재난과 관련된 지명에 투영된 방재인식에 관한 연구 (A Study of Disaster Recognition Based on Disaster-related Place Names)

  • 박경;김선희
    • 한국지형학회지
    • /
    • 제17권2호
    • /
    • pp.15-28
    • /
    • 2010
  • 재해 유형별로 관련된 재해 지명어를 도출하여 지도 및 문헌, 지명정보서비스 등 전체 6종의 자료에 나타난 재해 관련 지명을 확인하고 수집하여 데이터베이스를 구축하였다. 이를 토대로 지명을 통해 나타나는 재해 유형별 지명의 지역별 분포 특성을 분석하여 현재 급증하고 있는 재난에 대비한 방재대책 수립 및 방재영향평가에 활용될 수 있는 가능성을 탐색하고자 하였다. 자연재해와 방재 관련 지명을 대상으로 총 128개의 재해 유형별 재해 지명어를 먼저 추출하였고, 이후 이 검색어를 중심으로 해동지도, 1872군현도, 오만분지일지형도, 지명총람, 신구대조 조선전도부군면리동명칭일람, 지명정보서비스 등 총 6종의 자료를 대상으로 재해 지명을 검색하여 DB화하였으며, 각 자료별로 지역별·재해 유형별 특성을 분석하였고, 활용방안을 제시하였다.

소리의 청각적 속성에 따른 감성차원 분석 (The Analysis of Sound Attributes on Sensibility Dimensions)

  • 한광희;이주환
    • 감성과학
    • /
    • 제9권1호
    • /
    • pp.9-17
    • /
    • 2006
  • 소리나 음악을 '감정, 감성의 언어'라고 표현한다. 이것은 소리라는 물리적 속성들이 인간의 감성 정보를 효과적이고 풍부하게 전달하는 좋은 수단일 수 있기 때문이다. 하지만 정보의 청각적 제시에 대한 효과적 방안을 연구하는 청각 디스플레이(auditory displays) 분야의 연구자들은 주로 특정 시스템 사용자의 과제수행 결과의 효율성 증진에만 초점을 맞추어 왔었다. 이러한 한계점을 극복하고 청각적 정보 제시의 적용 영역을 확장하고자 최근 많은 연구자들이 과제수행 결과뿐 아니라 개인의 선호와 감성적 만족이 더 중요한 요인이 될 수 있음을 지적하고 있다. 이런 배경으로 본 연구에서는 소리에 대한 감성어휘 수집과 분석을 통해 소리의 감성공간을 '즐거움(Pleasure)', '복잡성(Complexity)', '활동성(Activity)'의 세 개 차원으로 구축하고, 그 차원에서 음고(pitch), 음량(loudness), 음색(timbre), 그리고 지속시간(duration)과 같은 소리의 다양한 속성에 따른 감성의 이동을 체계적으로 살펴보았다. 그 결과, 각 차원들에서 소리의 여러 속성들에 따른 감성적 차이와 그 상호관계를 확인하였다. 결론적으로 이러한 결과들은 청각 사용자 인터페이스(Auditory User Interface)와 같이 청각 디스플레이(auditory displays) 분야에 적용되어 소리의 속성에 따라 감성 정보를 응용하여 사용자의 특성과 요구에 맞춰 정보를 제시하는 데 기여할 것이다.

  • PDF

인공 신경망의 한국어 운율 학습 (Learning of Artificial Neural Networks about the Prosody of Korean Sentences.)

  • 신동엽;민경중;임운천
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2001년도 추계학술발표대회 논문집 제20권 2호
    • /
    • pp.121-124
    • /
    • 2001
  • 음성 합성기의 합성음의 자연감을 높이기 위해 자연음에 내재하는 정확한 운율 법칙을 구하여 음성합성 시스템에서 이를 구현해 주어야 한다 무제한 어휘 음성합성 시스템의 문-음성 합성기에서 필요한 운율 법칙은 언어학적 정보를 이용해 구하거나, 자연음에서 추출하고 있다 그러나 추출한 운율 법칙이 자연음에 내재하는 모든 운율 법칙을 반영하지 못했거나, 잘못 구현되는 경우에는 합성음의 자연성이 떨어지게 된다. 이런 점을 고려하여 본 논문에서는 한국어 자연음을 분석하여 추출한 운율 정보를 인공 신경망이 학습하도록 하고 훈련을 마친 인공 신경망에 문장을 입력하고, 출력으로 나오는 운율 정보와 자연음의 운율 정보를 비교한 결과 제안한 인공 신경망이 자연음에 내재하고 있는 운율을 학습할 수 있음을 알 수 있었다. 운율의 3대 요소는 피치 , 지속시간, 크기의 변화이다. 제안한 인공 신경망이 한국어 문장의 음소 열을 입력으로 받아들이고, 각 음소의 지속시간에 따른 피치변화와 크기 변화를 출력으로 내보내면 자연음을 분석해 구한 각 음소의 운율 정보인 목표 패턴과 출력 패턴 의 오차를 최소화하도록 인공 신경망의 가중치를 조절할 수 있도록 설계하였다. 지속시간에 따른 각 음소의 피치와 크기 변화를 학습시키기 위해 피치 및 크기 인공 신경망을 구성하였다. 이들 인공 신경망을 훈련시키기 위해 먼저 음소 균형 문장 군을 구축하여야 하고, 이들 언어 자료를 특정 화자가 일정 환경에서 읽고 이를 녹음하여 , 분석하여 구한운율 정보를 운율 데이터베이스로 구축하였다. 문장 내의 각 음소에 대해 지속 시간과 피치 변화 그리고 크기 변화를 구하고, 곡선 적응 방법을 이용하여 각 변화 곡선에 대한 다항식 계수와 초기 값을 구해 운율 데이터베이스를 구축한다. 이 운율 데이터베이스의 일부는 인공 신경망을 훈련시키는데 이용하고, 나머지로 인공 신경망의 성능을 평가하여 인공 신경망이 운율 법칙을 학습할 수 있었다. 언어 자료의 문장 수를 늘리고 발음 횟수를 늘려 운율 데이터베이스를 확장하면 인공 신경망의 성능을 높일 수 있고, 문장 내의 음소의 수를 감안하여 인공 신경망의 입력 단자의 수는 계산량과 초분절 요인을 감안하여 결정해야 할 것이다

  • PDF

한국어 병렬문의 통사, 의미, 문맥 분석을 위한 결합범주문법 (Combinatory Categorial Grammar for the Syntactic, Semantic, and Discourse Analyses of Coordinate Constructions in Korean)

  • 조형준;박종철
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제27권4호
    • /
    • pp.448-462
    • /
    • 2000
  • 자연언어처리에 있어서 병렬구문은 분석의 복잡성, 단어의 애매성, 서술어 생략 등에 따른 처리의 어려움을 내포하고 있다. 본 논문에서는 한국어에서 발생하는 병렬문의 통사적 특징을 능력문법 (competence grammar)의 입장에서 접근하고 분석된 결과를 기반으로 하여 한국어 병렬문 해석을 위한 결합범주문법 (Combinatory Categorial Grammar)을 제안한다. 제안된 결합범주문법을 사용해서 병렬문에 대한 각각 다른 수준의 통사적, 의미적, 문맥적 정보들이 사전에 어휘적으로 통합될 수 있고 통합된 정보를 이용하여 통사적, 의미적, 문맥적 분석들이 각각 다른 수준의 처리를 거치지 않고 동시에 점진적으로 유도될 수 있음을 보인다. 유도된 정보들을 통해 일반적으로 한국어 병렬문의 주된 기능이라고 생각되는 두 문장이 가지는 정보를 대조, 비교하는 기능이 표현될 수 있음을 보인다. 말뭉치를 분석하여 병렬문이 한국어 처리에서 차지하는 비중과 제시한 문법으로 처리할 수 없는 문형들에 대한 논의를 제공한다.

  • PDF

한글문서 분류용으로 이용할 복합어로 구성된 분야연상어의 추출법 (An Extraction Algorithm of Compound Field-associated Terms for Korean Document Classifications)

  • 이상곤
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제32권7호
    • /
    • pp.636-649
    • /
    • 2005
  • 분야연상어는 어휘자체가 분야정보를 가지므로 인간이 분야를 인지할 때와 유사하게 문서의 분야를 판단한다. 한국어의 경우 180분야로 분류된 약 IS,000개의 문서뱅크를 수집하여 구축 $\cdot$실험한 결과 88,782개의 단일 분야연상어가 8,405개로 전체의 약 9$\%$로 압축되며, 재현율 0.77 이상(평균 0.85), 정확률 0.90 이상(평균 0.94)의 높은 추출 정밀도를 얻었다. 구축한 분야연상어를 문서분류의 초기결정에 적용하여 인간에 의한 분야결정과 비교한 결과 약 90$\%$이상의 정답률을 얻었다. 연구결과를 문서분류의 초기단계에 관한 기초연구로 이용하고, 다언어(multilingual) 간의 문서검색에 적용하여 다국어 정보검색에 대한 기초 연구로 이용할 수 있다.

웹툰 콘텐츠 추천을 위한 소비자 감성 패턴 맵 개발 (Development of Customer Sentiment Pattern Map for Webtoon Content Recommendation)

  • 이준식;박도형
    • 지능정보연구
    • /
    • 제25권4호
    • /
    • pp.67-88
    • /
    • 2019
  • 웹툰은 인터넷의 특징적 요소들을 활용하여 제작되는 만화 콘텐츠를 온라인 환경에서 소비 가능한 형태로 유통하는 한국형 디지털 만화 플랫폼이다. 최근 웹툰 산업의 급격한 성장과 함께 웹툰 콘텐츠의 공급량이 기하급수적으로 증가함에 따라, 효과적인 웹툰 콘텐츠 추천 방안의 필요성이 커지고 있다. 웹툰은 회화적 요소와 문학적 요소, 디지털 요소의 복합적 산물로서, 독자로 하여금 재미를 느끼게 하고 웹툰이 연출하는 상황에 이입·공감하게 하는 등 소비자의 감성을 자극하는 디지털 콘텐츠 상품이다. 따라서 웹툰이 소비자에게 전달하는 감성이 소비자가 웹툰을 선택함에 있어 중요한 기준으로 작용할 것이라 기대할 수 있다. 본 연구는 기존에 충분히 논의되지 않았던 소비자 감성을 중심으로, 웹툰 콘텐츠의 효과적인 추천을 지원할 수 있는 소비자 감성 패턴맵의 개발을 목적으로 한다. 본 연구의 수행을 위해 '네이버 웹툰' 플랫폼에서 서비스되는 200개 작품에 대한 메타데이터와 소비자 감성어휘 정보를 수집하였다. 분석 목적에 부합하지 않는 작품을 제외한 127개 작품에 대해 488개의 감성어휘가 수집되었다. 이후 수집된 감성어휘들 간 유사감성 통합, 중복감성 배제 과정을 Bottom-up 접근으로 수행하여 총 63개 감성유형으로 축소된 웹툰 특화 감성지표를 구축하였다. 구축한 감성지표에 대한 탐색적 요인분석을 수행하여 웹툰 유형을 분류할 수 있는 3개의 중요 차원을 도출하고, 이를 기준으로 K-Means 클러스터링을 수행하여 전체 웹툰을 4개 유형으로 분류하였다. 각각의 유형에 대해 웹툰-감성 2-Mode 네트워크를 구축하여 웹툰 유형별로 나타나는 감성 패턴의 특징을 살펴보았으며, 프로파일링 분석을 통해 웹툰 유형별 인사이트와 실무적으로 의미 있는 전략적 시사점을 도출할 수 있었다. 본 연구의 결과를 통해 웹툰의 추천 및 분류의 영역에서 소비자 감성의 활용 가능성을 확인하고, 웹툰 생태계 내 구성원들이 소비자를 보다 잘 이해하고 전략을 수립할 수 있도록 돕는 가이드라인을 제시하였다는 점에서 의의가 있다.

In Vitro 소화시 lgy항체 활성의 안정성에 대한 계란 성분의 효과 (Effect of Eff Component on Stability of IgY Antibody Acitivity to In Vitro Digestion)

  • 이승배;최석호
    • 한국축산식품학회지
    • /
    • 제20권4호
    • /
    • pp.303-310
    • /
    • 2000
  • In vitro 소화시 계란 성분이 anti-Y ruckeri IgY 항세 활성을 안정화시키는데 어떡해 관여하는지를 SDS-PAGE와 ELISA로 조사한 결과는 다음과 같다. Anti-Y ruckeris IgY 항체와 난황 및 난백으로 혼합 후 펩신으로소화시킨 후 경우 1시간 후 난황 및 난백이 혼합된 시료에서 모두 anti-Y ruckeri IgY 항체의 heavy chain과 light chain이 분해는 되었지만 어느 정도 밴드를 관찰할 수있었으며, anti-Y, ruckeri IgY 항체 활성 측정한 결과 난황시료는 35%, 난백시료는 61%의 항체 활성을 유지시켰다. Anti-Y ruckeri IgY 항체와 오보알부민, 오보뮤우신, 라이소자임 및 오보뮤코이드를 혼합 한 후 펩신으로 소화시킨 경우 1시간 우에는 anti-Y, ruckeri IgY항체의 heavy chain의 밴드르 fdjsm 정도 볼 수 있는 형태로 나타났으며, anti-Y, ruckeri IgY 항체의 light chain는 오보뮤우신 및 오보뮤코이드가 홉합되어 펩신으로 소화시킨 경우 1시간 후에는 밴드를 거의 볼수 없었으나 오보알부민 오보트란스훼린 및 라이소자임에 혼합된 시료에서 밴드를 관찰할수 있었다. 특히 라이소자임과 오보트란스훼린의 경우 펩신 호화 2시간 우에도 anti-Y, ruckeri IgY 항체의 light 밴드가 관찰되었다. 펩신소화 1시간 후에 난백성분이오보알부민, 오보뮤우신, 라이소자임, 오보트란스웨린 및 오부뮤코이드 중에서 단지 오보트란스훼린만이 38%의 anti-Y, ruckeri IgY 항체 활서을 보인후 2시간 후에도 15% 정동의 활성을 나타내었다. anti-Y, ruckeri IgY항체와 난백 및 전란을 혼합한 다음 무지개송어 위 추출액으로 소화시 2시간 후에 난백은 14%, 전란은 69%로 anti-Y, ruckeri IgY 항체 활성을 유지시킨 것으로 나타났다.X> $e_{I}$ WPi_BE_QE]]]]]로 상징하며 WLWQ에 적용되는 몇 가지 제약을 관찰하고 이를 일반적인 언어원리로 설명한다. 첫째, XP는 주어로만 해석되는데 그 이유는 XP가 목적어 혹은 부가어 등 다른 기능을 할 경우 생략 부위가 생략의 복원 가능선 원리 (the deletion-up-to recoverability principle)를 위배하기 때문이다. 둘째, WLWQ가 내용 의문문으로만 해석되는데 그 이유는 양의 공리(the maxim of quantity: Grice 1975) 때문이다. 평서문으로 해석될 경우 WP에 들어갈 부분이 XP의 자질의 부분집합에 불과하므로 명제가 아무런 정보제공을 하지 못한다. 반면 의문문 자체는 정보제공을 추구하지 않으므로 앞에서 언급한 양의 공리로부터 자유롭다. 셋째, WLWQ의 XP는 주제어 표지 ‘는/-은’을 취하나 주어표지 ‘가/-이’는 취하지 못한다(XP-는/-은 vs. XP-가/-이). 이는 IP내부 에 비공범주의 존재 여부에 따라 C의 음운형태(PF)가 시성이 정해진다는 가설로 설명하고자 했다. WLWQ에 대한 우리의 논의가 옳다면, 본 논문은 다음과 같은 이론적 함의를 기닌다. 첫째, WLWQ의 존재는 생략에 대한 두 이론 즉 LF 복사 이론과 PF 삭제 이론 중 전자의 입장을 지지한다. 둘째, WP를 XP로부터 복원할 때 부분 자질만 복사된다. 이는 어휘가 통사층위로 들어온 이후에도 어휘 자질들이 완전히 동결되는 것이 아니라 계속 지시될 수 있다는 가설을 지지한다.

  • PDF

검색의도 파악을 위한 질의어 관계유형에 관한 사례연구 (A Case Study on the Types of Queries' Relations for Recognizing User intention)

  • 권순진;김원일;유성준
    • 한국지능시스템학회논문지
    • /
    • 제21권4호
    • /
    • pp.414-422
    • /
    • 2011
  • 본 연구는 정보 검색(Information Retrieval)과정에 있어 검색 기술의 적합성을 향상하기 위하여, 질의어 사이의 유용한 관계를 드러내도록 사례를 분석하고, 질의자의 의도를 파악할 수 있게끔 구체화하도록 연구한 것이다. 이를 위하여 먼저, 질의어가 가지는 어휘 의미적 연구 분야와 존재론적 연구 분야의 관련 연구들을 분석하였으며, 국내.외의 어휘 의미론적 네트워크 사례와 정보 검색 기술이 적용된 사이트의 실제 데이터를 분석하여 관계 유형을 추출하고 분석하였다. 다음으로는 일반적으로 검색자가 직면하는 검색 상황에서 자주 발생하는 문제를 중심으로 문제점을 정의하여 해결 방안을 모색하였다. 현행 검색 기술에서 색인어와 질의어를 단순 비교하여 결과를 쏟아주는 검색은 사용자를 혼란하게 하기 때문에 개선이 필요하고, 질의자의 의도에 맞는 질의 결과를 줄 수 있도록 지능적 검색으로 개선할 필요가 있다. 문제점 해결 방안에 있어서는, 두 질의어 사이의 관계를 드러냄으로써, 검색자의 의도를 인식하고 식별 및 처리할 수 있는 방안이 필요하였다. 질의어들에 관한 실제 사례를 분석하고 관계 유형을 9가지로 분류함으로써, 관계 유형을 디자인하는 방법을 적시하였으며, 관계 유형의 명칭 부여와 관계 역할의 명칭을 부여할 수 있는 방법과 제한점도 예시하였다.