• 제목/요약/키워드: 텍스트분석

검색결과 2,736건 처리시간 0.029초

Coreference Resolution을 위한 3인칭 대명사의 선행사 결정 규칙 (Antecedent Decision Rules of Personal Pronouns for Coreference Resolution)

  • 강승식;윤보현;우종우
    • 정보처리학회논문지B
    • /
    • 제11B권2호
    • /
    • pp.227-232
    • /
    • 2004
  • 정보 검색 시스템에서 문서의 내용을 대표하는 용어를 추출하거나 정보 추출 및 텍스트 마이닝에서 특정 정보만을 추출하려면 고유명사에 대한 대용어 문제가 해결되어야 한다. 대용어 해소 문제는 인칭 명사에 대한 대명사의 선행사 결정 문제가 대표적이다. 본 논문에서는 한국어에서 문서의 내용을 보다 정확히 분석하기 위해 3인칭 대명사 “그/그녀/그들/그녀들”의 선행사를 결정하는 방법을 제안한다. 일반적으로 3인칭 대명사의 선행사는 현재 문장 또는 이전 문장의 주어인 경우가 많고, 또한 3인칭 대명사가 2회 이상 반복되는 경우가 자주 발생한다. 이러한 특성을 이용하여 현재 문장과 이전 문장에 출현한 인칭 명사들 중에서 선행사로 사용되는 경우를 조사하여 선행사 결정 규칙을 발견하였다. 이 경험 규칙은 3인칭 대명사의 격에 따라 조금씩 달라지기 때문에 대명사의 격에 따라 주격, 목적격, 소유격으로 구분하여 기술하였다. 제안한 방법의 타당성을 검증하기 위하여 신문 기사의 정치 관련 문서에서 대명사의 격에 따라 100개씩 총 300개의 실험 대상을 선정하였으며, 실험 결과로 3인칭 대명사의 선행사 결정 정확도는 재현율이 79.0%, 정확률이 86.8%로 나타났다.

주5일 근무제 관련광고의 표현차별화 방식-라이프 스타일 및 인지 불균형의 관점에서 (Differentiation of expression on 5-day workweek concerned advertising -focused on lifestyle and cognitive inconsistency perspective)

  • 이현우
    • 디자인학연구
    • /
    • 제17권1호
    • /
    • pp.25-36
    • /
    • 2004
  • 이 연구는 라이프스타일의 변화를 반영한 광고들의 표현 차별화 방식을 살펴보는 데 목적을 두었다. 이를 위해 라이프스타일과 관련해서 최근 이슈가 되고 있는 주5일 근무제와 관련있는, 비교적 표현의 차별화에 성공한 광고들을 중심으로 분석과 해석을 시도했다. 연구대상 광고텍스트는 주5일 근무제와의 관련성 및 부정 소구, 과장성 표현, 정도가 높은 유머소구 등의 인지불균형적 표현들을 기준으로 선정되었다. 이들 광고들은 광고오디언스의 주의를 환기하고 지각을 강화시키는, 비교적 주목성이 높은 표현내용을 담고 있는 것으로 평가되었다. 네거티브 어프로치, 과장성 어프로치, 유머스런 어프로치 등은 기존에 광고청중이 형성하고 있던 가치와 신념체계에 반하는 요소를 지님으로써 자극을 높여 광고에 대한 호기심을 유발하는 데는 성공하는 것으로 보인다. 그러나 광고효과의 상위단계인 욕구, 기억, 구매의도를 창출하기 위해서는 인지불균형을 해소해서 인지적 조화를 이루게 하는 표현요소가 모색되어야 할 것이다. 한편 라이프스타일의 측면에서 보면, 국내 신용카드 광고의 경우 소비촉진형 표현이 가장 일반적으로 나타났다. 특히 신용카드의 사용이 마치 경제적 능력임을 암시하는 듯한 표현도 상당수 볼 수 있었다. 또한 젊은 세대를 대상으로 하는 제품 카테고리일수록 유희적 욕구표현의 광고가 전형적인 형태로 나타났다. 여행의 기회가 늘어나면서 펜션과 주말별장이 각광을 받고 삶의 질이 높아지면서 전원주택에 대한 관심도 커졌다, 이에 따라 온가족이 동질성과 연대성을 확인하고 휴식의 의미를 돌아보게 하는 가족중심형 광고도 있었다.은 z-x 평면상의 수평편파 및 z-y 평면상의 수직편파 방사패턴에서 각각 108$^{\circ}$ 및 93$^{\circ}$로서, 평면형과 비교시 각각 52$^{\circ}$ 및 27$^{\circ}$ 증가되었다. 최대이득은 z-x평면상의 수평편파 패턴에서 2.5 dBd로 평면형에 비해 1.7 dB 저하되었다. 축비는 설계주파수 1.575 GHz에서 1.5 dB를 얻었으며, 2 dB 이하 축비 대역폭은 20 MHz (1.3 %)를 얻었다./TEX>저장시 14∼21일, $0^{\circ}C$저장시 28∼49일 점질물이나 산패취가 발생하여 상품적 가치를 상실하였고, -2$0^{\circ}C$에서는 80일간 저장기간 동안에 이들 변화는 나타나지 않았다.ronment of store"were the three most important factors when they decided the place to buy fruits and vegetables. "Being treated as a valuable customer" and "ease of finding things"were the two least important factors. Families whose housewives were in their thirties valued "cleanness of the store"and "being treated as a valuable customer"important factors

  • PDF

인터넷 홈서버를 위한 스트리밍 전용 파일 시스템 (File System Support for Multimedia Streaming in Internet Home Appliances)

  • 박진연;송승호;진종현;원유집;박승민;김정기
    • 방송공학회논문지
    • /
    • 제6권3호
    • /
    • pp.246-259
    • /
    • 2001
  • 최근 급속도로 확장되고 있는 인터넷을 통한 동영상 서비스와 이미 상용 서비스가 시작된 디지털 방송 서비스 등으로 인하여, 가전제품에서 디지털 동영상을 처리하는 데에 관한 관심이 매우 높아지고 있다. 텍스트 기반이나 이미지 기반 데이터와 달리 멀 티미디어 데이터는 정보의 출발점으로부터 미리 정해진 시간가지 작업의 목적지에 도달하지 않으면 원래 전달하고자 했던 자료의 의미를 제대로 전달할 수 없다. 멀티미디어 스트리밍 전용 시스템은 데이터를 정해진 시간가지 목표에 전달하는 것을 궁극적인 목표로 하고 설계되어야 한다. 이러한 시간적 제약성 때문에, 멀티미디어 스트리밍 응용은 많은 디스크 대역폭을 필요로 하고, 파일 시스템에 많은 부하를 가하게 된다. 기존에 사용되는 대부분의 범용 파일 시스템은 스트리밍 부하의 특성인 순차적 읽기에 적합하게 설계되어 있지 않다 따라서, 스트리밍 환경을 위해서 사용되기 위해서는 많은 개선의 여지를 가지고 있다 본 논문에서는, 멀티미디어 스트리밍 부하의 특성을 분석하고, 이에 최적화된 파일 시스템을 설계한다. 설계된 파일 시스템을 구현하여 범용 파일 시스템과의 성능평가 실험을 수행하였다. 성능 평가 결과 본 논문에서 제시하는 파일 시스템이 순차적 파일 접근의 경우 기존의 유닉스 계열에서 제공되는 파일 시스템 보다 월등한 성능을 보이는 것을 관찰할 수 있었다. 이와 더불어 효율적으로 동영상 자료를 접근할 수 있도록, MPEG-4 압축방식에 특화된 커널 수준의 파일 시스템 APIl를 제안한다.

  • PDF

국가 과학기술 표준분류 체계 기반 연구보고서 문서의 자동 분류 연구 (Research on Text Classification of Research Reports using Korea National Science and Technology Standards Classification Codes)

  • 최종윤;한혁;정유철
    • 한국산학기술학회논문지
    • /
    • 제21권1호
    • /
    • pp.169-177
    • /
    • 2020
  • 과학기술 분야의 연구·개발 결과는 연구보고서 형태로 국가과학기술정보서비스(NTIS)에 제출된다. 각 연구보고서는 국가과학기술 표준 분류체계 (K-NSCC)에 따른 분류코드를 가지고 있는데, 보고서 작성자가 제출 시에 수동으로 입력하게끔 되어있다. 하지만 2000여 개가 넘는 세분류를 가지고 있기에, 분류체계에 대한 정확한 이해가 없이는 부정확한 분류코드를 선택하기 십상이다. 새로이 수집되는 연구보고서의 양과 다양성을 고려해 볼 때, 이들을 기계적으로 보다 정확하게 분류할 수 있다면 보고서 제출자의 수고를 덜어줄 수 있을 뿐만 아니라, 다른 부가 가치적인 분석 서비스들과의 연계가 수월할 것이다. 하지만, 국내에서 과학기술표준 분류체계에 기반을 둔 문서 자동 분류 연구 사례는 거의 없으며 공개된 학습데이터도 전무하다. 본 연구는 KISTI가 보유하고 있는 최근 5년간 (2013년~2017년) NTIS 연구보고서 메타정보를 활용한 최초의 시도로써, 방대한 과학기술표준 분류체계를 기반으로 하는 국내 연구보고서들을 대상으로 높은 성능을 보이는 문서 자동 분류기법을 도출하는 연구를 진행하였다. 이를 위해, 과학기술 표준분류 체계에서 과학기술 분야의 연구보고서를 분류하기에 적합한 중분류 210여 개를 선별하였으며, 연구보고서 메타 데이터의 특성을 고려한 전처리를 진행하였다. 특히, 가장 영향력 있는 필드인 과제명(제목)과 키워드만을 이용한 TK_CNN 기반의 딥러닝 기법을 제안한다. 제안 모델은 텍스트 분류에서 좋은 성능을 보이고 있는 기계학습법들 (예, Linear SVC, CNN, GRU등)과 비교하였으며, Top-3 F1점수 기준으로 1~7%에 이르는 성능 우위를 확인하였다.

IT 컨설팅 회사의 지적 자산 관리를 위한 지식관리시스템 (KMSCR: A system for managing knowledge assets of an IT consulting firm)

  • 김수연;황현석;서의호
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2001년도 춘계정기학술대회
    • /
    • pp.233-239
    • /
    • 2001
  • 최근 대부분의 회사들은 업무를 수행하는데 필요한 지식과 노하우를 공유하고 재사용하기 위하여 지적 자산 관리의 중요성을 인식하고 있다. 특히 고도로 지식 집약적인 업종이라 할 수 있는 IT컨설팅 회사에서는 지적 자산의 관리가 다른 어떤 회사에서보다 큰 중요성을 가지게 된다. 컨설팅 회사에 있어서 검증이 완료된 지적 자산의 공유 및 지능적이면서도 신속한 검색은 컨설팅 서비스의 품질과 고객 만족에 직결되는 중요한 요소이다. 따라서 대부분의 컨설팅 회사들은 자사의 지식 자산을 관리하기 위하여 많은 노력을 기울이고 있다. 본 논문의 목적은 IT 컨설팅 회사예서 관리되는 다양한 형태의 지적 자산들을 중앙 관리하여 설친 고객 사이트에 흩어져 프로젝트를 수행하는 컨설턴트들이 공유할 수 있도록 함으로써 컨설팅 서비스의 생산성과 품질들 높이고자 하는데 있다 이를 위하여 건설팅 회사에서 관리되는 모든 지적 자산의 재고를 조사하여 모델링하고 이를 쉽게 저장하고 검색할 수 있는 시스템 아키텍처를 제안한다. 제안된 아키텍처를 NT 기반에서 Index server를 이용하여 시스템으로 구현하였다 (KMSCR: A Knowledge Management System for managing Consulting Resources). KMSCR에서는 컨설턴트가 찾고자 하는 검색어를 입력하면 다양한 포맷의 (.doc, .ppt, xls, .rtf, .txt, .html 등과 같은) 결과물을 관련성이 높은 순서대로 출력해 줌으로써 컨설팅 리소스를 효과적으로 재사용할 수 있도록 도와 준다. 또한 검색 시에는 미리 등록된 키워드 뿐 아니라 본문 내의 텍스트 검색까지 가능하게 함으로써 컨설팅 리소스에 대한 보다 효과적이고 효율적인 검색을 가능하게 한다.간을 성능 평가 인자로 하여 수행하였다. 논문에서 제한된 방법을 적용한 개선된 RICH-DP을 모의 실험을 통하여 분석한 결과 기존의 제한된 RICH-DP는 실시간 서비스에 대한 처리율이 낮아지며 서비스 시간이 보장되지 못했다. 따라서 실시간 서비스에 대한 새로운 제안된 기법을 제안하고 성능 평가한 결과 기존의 RICH-DP보다 성능이 향상됨을 확인 할 수 있었다.(actual world)에서 가상 관성 세계(possible inertia would)로 변화시켜서, 완수동사의 종결점(ending point)을 현실세계에서 가상의 미래 세계로 움직이는 역할을 한다. 결과적으로, IMP는 완수동사의 닫힌 완료 관점을 현실세계에서는 열린 미완료 관점으로 변환시키되, 가상 관성 세계에서는 그대로 닫힌 관점으로 유지 시키는 효과를 가진다. 한국어와 영어의 관점 변환 구문의 차이는 각 언어의 지속부사구의 어휘 목록의 전제(presupposition)의 차이로 설명된다. 본 논문은 영어의 지속부사구는 논항의 하위간격This paper will describe the application based on this approach developed by the authors in the FLEX EXPRIT IV n$^{\circ}$EP29158 in the Work-package "Knowledge Extraction & Data mining"where the information captured from digital newspapers is extracted and reused in tourist information context.terpolation performance of CNN was relatively

  • PDF

FIB를 이용한 다이아몬드 기판 위의 나노급 미세 패턴의 형상 가공 (Nano-scale Patterning on Diamond substrates using an FIB)

  • 송오성;김종률
    • 한국산학기술학회논문지
    • /
    • 제7권6호
    • /
    • pp.1047-1055
    • /
    • 2006
  • 필드이온빔(FIB) 가공기를 써서 초고강도의 벌크다이아몬드를 가공하기 위해 이온 소오스의 종류와 가공 조건에 따른 나노급 미세 선폭의 최적조건을 알아보고 이에 근거한 2차원적인 텍스트의 가공과 3차원적인 박막요소의 가공을 시도하였다. 다이아몬드 기판과 실리콘 기판을 Ga과 $H_2O$ 소오스를 이용하는 FIB를 써서 30 kV 빔 전류를 10 pA $\sim$ 5 nA로 변화시키면서 패터닝하고 이때 각각 20 ${\mu}m$ 길이로 생성되는 선형 패턴의 선폭, 깊이, 에치속도, 에치형상, 깊이선폭비 (aspect ratio)를 확인하였다. 다이아몬드도 실리콘 기판과 마찬가지로 나노급 패턴의 형성이 가능하였다. $H_2O$ 소오스를 채용한 경우가 에치 깊이가 2배 정도 증가하였으며 동일한 가공 조건에서는 실리콘에 비해 다이아몬드의 에치 선폭이 감소는 경향이 있었다. 특히 다이아몬드는 절연성 때문에 차지가 축적되어 가공 중 이온빔이 불안정해지는 문제가 있었으나 차지 중화 모드를 이용하여 성공적으로 sub-100 nm급 선폭의 미세 가공이 가능하였다. 확인된 선폭가공 조건에 근거하여 2차원적으로 0.3carat의 보석용 다이아몬드의 거들부에 300여개의 글자를 FIB를 활용하여 선폭 240 nm정도로 명확히 기록하는 것이 가능하였다. $Ga^+$이온과 30 eV-30 pA로 조건에서 비교적 넓은 선폭과 Z축 depth 고정범위에서 많은 개인정보의 기록이 영구적으로 가능하였으며 전자현미경으로 재생이 가능하였다. 3차원적으로 두께 $1{\mu}m$의 박막요소를 FIB가공과 백금 용접으로 떼어낸 후 FIB가공으로 두께가 100 nm가 되도록 한 후 투과전자현미경을 이용하여 성분 분석을 하는 것이 성공적으로 수행될 수 있었다.

  • PDF

가상대학에서 교수자와 학습자간 상호작용을 위한 지식기반형 문자-얼굴동영상 변환 시스템 (Knowledge based Text to Facial Sequence Image System for Interaction of Lecturer and Learner in Cyber Universities)

  • 김형근;박철하
    • 정보처리학회논문지B
    • /
    • 제15B권3호
    • /
    • pp.179-188
    • /
    • 2008
  • 본 논문에서는 가상대학에서 교수자와 학습자간 상호작용을 위한 지식기반형 문자-얼굴동영상 변환(TTFSI : Text to Facial Sequence Image) 시스템에 관해 연구하였다. TTFSI 시스템의 구현을 위해, 한글의 문법적 특징을 기반으로 가상강의에 사용된 자막정보에 립싱크된 얼굴 동영상 합성하기 위하여 자막정보를 음소코드로 변환하는 방법, 음소코드별 입모양의 변형규칙 작성법, 입모양 변형규칙에 의한 얼굴 동영상 합성법을 제안한다. 제안된 방법에서는 한글의 구조분석을 통해 기본 자모의 발음을 나타내는 10개의 대표 입모양과 조음결합에서 나타나는 78개의 혼합 입모양으로 모든 음절의 입모양을 표현하였다. 특히 PC환경에서의 실시간 영상을 합성하기 위해서 매 프레임마다 입모양을 합성하지 않고, DB에서 88개의 해당 입모양을 불러오는 방법을 사용하였다. 제안된 방법의 유용성을 확인하기 위하여 텍스트 정보에 따른 다양한 얼굴 동영상을 합성하였으며, PC환경에서 구현 가능한 TTFSI 시스템을 구축하였다.

인터넷 뉴스 데이터 텍스트 분석을 통해 본 우리나라 농촌다움에 대한 이미지 연구 (The Image of Ruralism in Korea through a Text Mining for Online News Media analysis)

  • 손용훈;김용진
    • 농촌계획
    • /
    • 제25권4호
    • /
    • pp.13-26
    • /
    • 2019
  • The rural areas in South Korea have changed rapidly in the process of national land development. Rural landscapes have become discoloured, and their attractiveness has decreased as cities have expanded. But the attractiveness or multifunctional values of rural areas has become more important in contemporary society around the world. According to this social demand, the efforts of conserving the rural landscape are of high priority and the recovery of ruralism in the area is required. This study has tried to understand how the public image of ruralism in South Korea has been influenced by the news media. The study retrieved news articles using the web searching portal site from the six keywords, commonly used to refer to ruralism, including 'rural landscape', 'rural community', 'rural tourism', 'rural life', 'rural amenity', and 'rural environment'. News data from the six keywords were also collected respectively from within the year-period of 2004-05, 2007-08, 2012-13, and 2016-17. In the text mining analysis, the nouns with high Degree Centrality were figured out, and the changes by year-period were identified. Then, LDA topic analysis was performed for text datasets of six keywords. As a result, the study found that the news articles gave an informed focus on only a handful of issues such as 'poor rural living condition', 'regional or village improvement projects', 'rural tourism promotion projects', and 'other government support projects'. On the other hand, nouns related to virtues and values in the rural landscape were less shown in news articles. These results have become more apparent in recent years. In the topic analysis, 35 topics were identified. 'village development projects', 'rural tourism', and 'urban-rural exchange projects' were appeared repeatedly in several keywords. Among the topics, there are also topics closely related to ruralism such as 'rural landscape conservation', 'eco-friendly rural areas', 'local amenity resources', 'public interest values of agriculture', and 'rural life and communities'. The study presented an image map showing ruralism in South Korea using a network map between all topics and keywords. At the end of the study, implications for Korean rural area policy and research directions were discussed.

고전소설 수업 비평 : "이야기꾼"으로서의 교사에 대한 주목 (Classic novel class criticism: teacher as a storyteller)

  • 박수진
    • 고전문학과교육
    • /
    • 제33호
    • /
    • pp.45-82
    • /
    • 2016
  • 수업은 교사와 학생의 교육적 만남을 매개(媒介)하는 학교 교육의 핵심적인 현상으로, 교과교육 연구의 중요한 대상이다. 교실 수업은 학교 교육에 기대하는 많은 것을 함축하고 있는 장면이기 때문에, 이러한 교실 수업현상이나 교사의 수업 행위를 깊이 있게 이해하고 해석할 수 있는 이론이자 방법으로서 수업 비평은 긴요하다. 이에 본 연구는 고전문학교육 연구의 지평을 수업 현상에 대한 실제적이고 경험적인 연구로 확장해 나가기 위한 시도로 고전소설 수업에 대한 수업 비평을 실시하였다. 본 연구에서 수업 비평의 텍스트로 삼은 고전소설 수업은 교과서의 작품에 대한 분석적 독해를 주로 하는 전형적인 고전소설 수업이었다. 그럼에도 교사는 고전소설에 대한 학생들의 막연한 거부감을 공감으로 전환시키면서, 작품을 감상하고 내면화할 수 있도록 이끌어 나가는 모습을 보였다. 자칫훈고주석에 치우칠 수밖에 없는 고전소설 수업에서 학생들의 공감과 반응이 들려올 수 있었던 데에는 작품에 대한 교사의 안목과 경험, 문학교육적 지식과 방법 등이 작품을 읽어 나가는 수업 전반에 투영되었기 때문이다. 특히 비교적 많은 시간을 할애하며 교사가 직접 작품의 서사를 구연(口演)해 나간 것은 고전소설 수업으로서의 그 가치와 의미를 여실히 드러낸 것으로 볼 수 있다. 이러한 수업 비평의 관점에 터해, 다기(多岐)한 장면으로 펼쳐지는 고전소설 수업의 실제 사례를 수집하고, 그 의미를 읽어내려는 시도가 거듭되어야 한다. 수업 비평과 같은, 수업 현상을 기반으로 하는 연구를 통해 고전문학교육에 대한 새로운 성찰과 발견이 가능해질 것이다.

대중매체의 과학기사에 대한 대중들의 인식과 고빈도로 사용되는 과학용어에 대한 이해도 조사 (Investigations on Public Perception of Science Articles in the Mass Media and Understanding of Scientific Terms Used in High Frequency in Science Articles)

  • 윤은정;박윤배
    • 한국과학교육학회지
    • /
    • 제39권4호
    • /
    • pp.535-544
    • /
    • 2019
  • 우리 사회에서 전통적 대중매체가 학교 교육 밖의 대중들에게 과학적 정보를 제공하는 수단으로서의 기능을 충분히 수행하고 있는지 알아보기 위하여 대중매체 과학기사에 대한 대중의 인식과 과학기사에 고빈도로 사용되고 있는 과학용어들에 대한 대중의 이해도를 조사해 보았다. 과학기사에 대한 대중의 인식을 알아보기 위하여 과학기사의 유용성, 중요성, 접근 빈도, 이해도를 묻는 설문 도구를 제작하여 기차역, 지하철역 등 유동인구가 많은 지역에서 설문조사를 실시하였고, 총 425명의 설문 응답을 분석에 사용하였다. 과학기사에 사용된 고빈도 과학용어를 추출하기 위하여 전통적 대중매체 가운데 텔레비전 뉴스와 신문을 각각 두 곳씩 지정하고 2001년부터 2017년까지 17년간 보도된 과학관련 기사의 텍스트를 수집하여 사용된 과학용어의 빈도를 조사하였다. 그리고, 빈도수를 기준으로 상위 100개의 과학 용어에 대하여 자기보고식의 이해도 검사를 실시하였다. 연구 결과 우리 사회의 대중들은 과학기사의 중요성과 유용성에 대해서는 비교적 높이 평가하고 있으나 기사를 읽고 이해하는 데에는 다소 어려움이 있는 것으로 나타났다. 또한 과학기사에 고빈도로 사용되고 있는 과학용어들에 대해 대학원 이상의 고학력, 자연계열 전공, 남성이 상대적으로 이해도가 높았다. 또한 성별, 연령, 학력, 전공계열에 따라 이해도가 높은 과학용어들이 특징적으로 나타났다.