• 제목/요약/키워드: 어휘사용빈도

검색결과 104건 처리시간 0.027초

말뭉치 자원 희소성에 따른 통계적 수지 신호 번역 문제의 해결 (Addressing Low-Resource Problems in Statistical Machine Translation of Manual Signals in Sign Language)

  • 박한철;김정호;박종철
    • 정보과학회 논문지
    • /
    • 제44권2호
    • /
    • pp.163-170
    • /
    • 2017
  • 통계적 기계 번역을 이용한 구어-수화 번역 연구가 활발해짐에도 불구하고 수화 말뭉치의 자원 희소성 문제는 해결되지 않고 있다. 본 연구는 수화 번역의 첫 번째 단계로써 통계적 기계 번역을 이용한 구어-수지 신호 번역에서 말뭉치 자원 희소성으로부터 기인하는 문제점들을 해결할 수 있는 세 가지 전처리 방법을 제안한다. 본 연구에서 제안하는 방법은 1) 구어 문장의 패러프레이징을 통한 말뭉치 확장 방법, 2) 구어 단어의 표제어화를 통한 개별 어휘 출현 빈도 증가 및 구어 표현의 번역 가능성을 향상시키는 방법, 그리고 3) 수지 표현으로 전사되지 않는 구어의 기능어 제거를 통한 구어-수지 표현 간 문장 성분을 일치시키는 방법이다. 서로 다른 특징을 지닌 영어-미국 수화 병렬 말뭉치들을 이용한 실험에서 각 방법론들이 단독으로 쓰일 때와 조합되어 함께 사용되었을 때 모두 말뭉치의 종류와 관계없이 번역 성능을 개선시킬 수 있다는 것을 확인할 수 있었다.

온톨로지 기반의 자연어 검색 시스템 설계 및 구현 (Design and Implementation of Ontology-Based Natural Language Search System)

  • 강래구;임동일;정채영
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2007년도 추계종합학술대회
    • /
    • pp.875-878
    • /
    • 2007
  • 지금까지의 상품 검색 방법으로는 찾고자하는 정보를 검색할 때 주로 단어의 빈도수나 어휘 정보를 이용하는 키워드 기반의 검색이 주로 쓰이고 있었다. 키워드 기반의 검색에서는 사용자의 질의와 관련이 없는 문서들까지도 같은 결과로 나타내 주고 이로 인해 사용자는 제시된 결과를 한번 더 수동적으로 검색해야하는 부담을 않게 되었다. 이러한 문제점을 해결하기 위해 온톨로지가 대두되었다. 본 논문에서는 온톨로지를 이용한 상품 검색 시스템을 직접 구축하여 분류별 검색을 통해 얼마나 정확한 검색을 하는지 실험하였다. 실험을 위해 전국적으로 On/Off라인 할인점을 운영 중에 있는 A할인점의 상품 데이터 약 40,000여개를 데이터베이스로 구축하였고 User Interface 개발환경은 JSP와 PowerBuilder9.0을 사용하여 검색 시스템을 개발하여 실험하였다. 그 결과 본 논문에서 제안하고 설계한 상품 도메인 온톨로지를 이용한 검색 방법이 기존의 키워드 기반의 검색 방법보다 우수한 결과를 나타내고 있음을 입증하였다.

  • PDF

도메인 온톨로지를 이용한 검색 시스템 설계 및 구현 (Design and Implementation of Search System Using Domain Ontology)

  • 강래구;정채영
    • 한국정보통신학회논문지
    • /
    • 제11권7호
    • /
    • pp.1318-1324
    • /
    • 2007
  • 지금까지의 상품 검색 방법으로는 찾고자하는 정보를 검색할 때 주로 단어의 빈도수나 어휘 정보를 이용하는 키워드 기반의 검색이 주로 쓰이고 있었다. 키워드 기반의 검색에서는 사용자의 질의와 관련이 없는 문서들까지도 같은 결과로 나타내 주고 이로 인해 사용자는 제시된 결과를 한번 더 수동적으로 검색해야하는 부담을 않게 되었다. 이러한 문제점을 해결하기 위해 온톨로지가 대두되었다. 본 논문에서는 온톨로지를 이용한 상품 검색 시스템을 직접 구축하여 분류별 검색을 통해 얼마나 정확한 검색을 하는지 실험하였다. 실험을 위해 전국적으로 On/Off라인 할인점을 운영 중에 있는 A할인점의 상품 데이터 약 40,000여개를 데이터 베이스로 구축하였고 User Interface 개발환경은 JSP와 PowerBuilder9.0을 사용하여 검색 시스템을 개발하여 실험하였다. 그 결과 본 논문에서 제안하고 설계한 상품 도메인 온톨로지를 이용한 검색 방법이 기존의 기반의 검색 방법보다 우수한 결과를 나타내고 있음을 입증하였다.

텍스트 데이터 워드클라우드 분석을 위한 데이터 정제기법에 관한 연구 (A Study on Data Cleansing Techniques for Word Cloud Analysis of Text Data)

  • 이원조
    • 문화기술의 융합
    • /
    • 제7권4호
    • /
    • pp.745-750
    • /
    • 2021
  • 비정형 텍스트 데이터의 빅데이터 시각화 분석에서 원시 데이터는 대부분 대용량이고 비정형으로 정제하지 않고 분석기법을 적용할 수 없는 상태이다. 따라서 수집된 원시 데이터는 1차 휴리스틱 정제과정을 통해서 불필요한 데이터들을 제거하고 2차 머시인 정제과정을 통해서 불용어를 제거한다. 그리고 어휘의 빈도수를 계산하여 워드클라우드 기법으로 시각화하고 핵심 이슈들을 추출하여 정보화하고 그 결과를 분석한다. 본 연구에서는 파이썬 워드클라우드에서 외부 불용어 Set(DB)를 사용한 새로운 불용어 정제기법을 제안하고 실무 사례분석을 통하여 이 기법의 문제점과 효용성을 도출한다. 그리고 이 검증 결과를 통해 제안된 정제기법을 적용한 워드클라우드 분석의 실무적용에 대한 효용성을 제시한다.

화장품광고에 나타난 언어메시지 표현분석 : 1958년~2018년의 아모레퍼시픽 뷰티매거진<향장>을 중심으로 (Analysis of Language Message Expression in Beauty Magazine's Cosmetic Ads : Focusing on "Hyang-jang", AMOREPACIFIC's from 1958 to 2018)

  • 최은섭
    • 한국엔터테인먼트산업학회논문지
    • /
    • 제13권7호
    • /
    • pp.99-118
    • /
    • 2019
  • 본 연구는 1958년부터 2018년까지 60년간 아모레퍼시픽이 발간해온 뷰티매거진 <향장>에 실린 718편의 화장품광고에 나타난 언어메시지를 내용분석하였다. 즉 화장품광고의 언어메시지에 표현된 구매정보, 설득적 표현, 어휘종류(어종)가 시대별, 제품군 별로 어떻게 표현되었는지를 살펴봄으로써 실무적으로는 화장품광고의 전략적 표현에 대한 고찰과 접근방법을 모색하고 학술적으로는 향후 화장품광고의 연구 방향을 제시하고자 하였다. 연구결과는 첫째, 화장품광고의 구매정보는 기본적으로 실속구매나 개인만족 정보를 전달하고 있지만, 최근으로 올수록 브랜드충성 정보의 비중이 높아졌다. 메이크업제품의 경우 계절, 패션 트렌드 등을 강조하는 유행지향의 비중이 높았으나, 2010년대 이후부터는 브랜드충성 구매정보의 비중이 늘었다. 화장품의 글로벌 브랜드 전략이 광고에 적극 반영된 결과로 보인다. 둘째, 설득적 표현은 헤드라인과 바디카피가 다른 양상을 보였다. 먼저 헤드라인은 이미지형성중심 표현이 주로 사용되었다. 구체적으로는, 사용장면이미지 표현이 전반적으로 높게 나타난 가운데 1990년대 이전까지는 사용자이미지 표현이 높았고 최근으로 올수록 상표이미지 표현이 높게 나타났다. 바디카피는 정보전달중심 표현이 주로 사용되었는데, 그 중에서도 보편적 정보와 차별적 정보가 가장 많이 사용되었다. 따라서 화장품광고의 언어메시지는 소구방법을 단순히 이성소구와 감성소구로 나누기보다는 브랜드별로 확립된 이미지를 어떤 정보로 구체화할 것인지를 파악하는 것이 중요하다. 셋째, 어휘종류(어종)는 브랜드네임과 헤드카피로 나누어 살펴보았는데, 브랜드네임은 외래어가, 헤드카피는 한자어의 사용이 가장 높게 나타났다. 단, 1970~80년대에는 고유어 브랜드네임이 일시적으로 많이 나타났는데, 이는 이 시기에 고유어 상표를 권장하는 정부정책이 반영된 결과로 해석된다. 또한 메이크업제품에서는 외래어가, 남성제품에서는 한자어의 사용빈도가 상대적으로 높게 나타났는데, 이는 메이크업 제품의 경우 색상이나 계절을 외래어로 표현하는 경향이 높고, 남성제품은 소비자들의 한자어에 대한 권위나 신뢰의 추구성향이 언어메시지 표현에 반영된 것으로 풀이된다.

한.중.일 의학용어 비교 분석 - 심폐바이패스 영역를 중심으로 - (Comparative Analysis of Medical Terminology Among Korea, China, and Japan in the Field of Cardiopulmonary Bypass)

  • 김원곤
    • Journal of Chest Surgery
    • /
    • 제40권3호
    • /
    • pp.159-167
    • /
    • 2007
  • 배경: 한국, 중국, 일본 동아시아 3국의 의학용어에는 한자에서 유래된 어휘가 중요한 공통요소가 되고 있다. 본 연구는 의학용어 중 흉부외과학 분야의 심폐바이패스 관련 용어를 표본으로 채택한 후 한, 중, 일 3국간의 현행 용어들을 비교 분석함으로서 국내 의학용어를 새로운 각도에서 고찰하고 향후 3국간의 학술교류 발전에 일조하는 데에 그 목적이 있다. 대상 및 방법: 영어로 된 심폐바이패스 분야의 129개(표제 85 용어, 연관 44 용어) 용어를 선정한 뒤, 각국의 문헌 참조와 함께 한국의 서울대학병원, 일본의 동경삼정기념병원, 중국의 하얼빈 아동병원 및 연변복지병원의 도움을 받아 각국의 의학용어로 번역하고 이를 비교 분석하였다. 그리고 실제 임상에서 공식적인 의학용어 외에 영어 용어를 빈번히 사용하고 있는 현실을 감안하여 임상 상황에서 영어와 자국어의 혼용 빈도를 동시에 조사하였다. 결과: 총 129개 심폐바이패스 관련 용어 중 3국간의 용어가 한자에 근거를 두어 완전히 일치하는 경우는 모두 28개 용어로 전체의 21.7%였다. 3개국 중 2개국의 용어가 일치하는 경우는, 한 일 양국 용어가 일치하는 경우가 84예, 한중 양국 및 중일 양국이 일치하는 경우가 각각 1예였다. 이에 따라 한 일 간에서는 86.8%의 높은 용어 일치도를 보인 반면에 한중 간, 중일 간은 각각 24.8%의 일치도를 보였다. 공식 용어에서뿐만 아니라 임상에서의 영어 용어 혼용 빈도에서도 한 일 양국은 중국에 비해 영어 사용 빈도가 월등히 높았다. 결론: 본 연구는 의학용어 중 흉부외과학 분야의 심폐바이패스 관련 용어라는 한정된 부분의 비교 분석이라는 한계와, 자료 분석 상의 일부 제한점에도 불구하고 향후 한 중 일 삼국간의 학술적 이해와 의학용어의 진일보된 정립에 자그마한 바탕이 될 수 있을 것으로 생각한다.트리를 최소한의 노력으로 효율적으로 구현할 수 있다.에 따라 증가한다. 에틸렌 함량이 50 wt% 보다 많을 경우, 혼합용매들의 극성인력 효과가 밀도 효과보다 커서 온도가 낮아짐에 따라 cloud-point 압력은 증가하였다. 에틸렌 함량이 50 wt% 보다 적을 경우, 혼합용매들의 극성인력 효과가 밀도 효과보다 작아서 온도가 낮아짐에 따라 cloud-point 압력은 감소하였다. 2번 150.2 cGy, 200 cGy, 환자 3번 150.5 cGy, 211.4 cGy, 환자 4번 155.5 cGy 198.6 cGy의 결과를 얻었다. 결 론: 본 원에서 변형 근치적 유방절제술 후 흉벽 방사선치료의 가장 적절한 볼루스 적용 횟수는 전 치료횟수의 $50{\sim}60%$ 적용이다.적인 기준을 마련하고 환자들이 치료과정에서 실질적으로 알고자 하는 의문점들을 체계적으로 교육해 나간다면 지금까지 보다 훨씬 더 나은 환자 만족과 치료 결과를 얻을 수 있으리라 기대된다.적 교육 훈련이 더 엄격하게 진행되므로, 부서 관의 협력으로 방사선사 보수교육에 합산하는 방안이 필요할 것이다. 임신이 확인된 방사선관계종사자의 피폭관리도 새로이 반영되어야 할 것이다. 따라서 업무의 특성상 사용되는 특별한 용어 외에 공통적으로 사용되는 용어의 통일은 반드시 필요하며, 방사선분야의 법, 시행령, 시행규칙, 고시 등의 개정 시 반드시 방사선 관련 부서의 해당기관과 합의하여 개정되어야 할 것이고, 대한방사선사협회에서는 방사선사에 대한 법률을 구체적이고 체계적으로 명시할 필요성이 있다고 생각된다.는 경우 주식투자기간은 24개월이하의 중단기가 적합함을 발견하였다. 이상의 행태적 측면과 투자성과측면의 실증결과를 통하여 한국주식시장에 있어서 시장수익률을 평균적으로 초과할 수 있는 거래전략은 존재하므로 이러한 전략을 개발 및

제17대 대통령 후보 합동 토론 언어네트워크 분석 - 북한 관련 이슈를 중심으로 (Semantic Network Analysis of Presidential Debates in 2007 Election in Korea)

  • 박성희
    • 한국언론정보학보
    • /
    • 제45권
    • /
    • pp.220-254
    • /
    • 2009
  • 대통령 후보 합동 TV토론은 후보들의 정책과 인성의 상호 검증을 통해 민주적인 방식의 대통령 선출에 기여하는 중요한 선거 캠페인이다. 본 연구는 제17대 대통령 후보들이 TV합동토론에서 상호 교환한 어휘군(群)의 연결망을 언어네트워크 분석 소프트웨어인 KrKwic와 UCINET을 통해 분석하고 단어의 사용과 단어 간 거리를 비교 고찰함으로써 정치 토론의 실효성을 점검하고 북한 관련 이슈에 대한 후보 간 입장 차이를 규명하고자 했다. 연구 결과 이명박, 정동영, 이회창 세 후보의 상호토론에는 중심 논제의 구성이 본래 토론이 지향하는 상호이해의 구성요건인 접점(stasis)을 형성하기에 부적합하고, 단어의 선택과 사용빈도에서 생산적인 공방이나 토론의 교육적 효과에 대한 한계를 노정시킨 것으로 나타났다. 북한 관련 이슈 8개 단어들의 공출현 단어 간 거리 분석(co-occurrence matrix) 결과, 각 후보가 연결시킨 단어들 간의 관계를 통해 입장의 차이를 도식화할 수 있었다. 이명박 후보는 북한 문제를 남한과의 상대성에서 파악하는 경향을 보였으며, 이회창 후보는 한-미간의 관계 틀 안에서 북한 문제를 고려하고 북한문제와 핵문제를 동일시하는 것으로 드러났다. 또 정동영 후보는 북한의 문제를 한반도 문제로 개념화하고 북한과 전쟁을 연결 짓지 않는 특징을 나타냈다.

  • PDF

Topiramate의 신경성 폭식증 치료효과: 국내외 보고된 임상연구결과 및 치험사례 중심으로 (Topiramate for the Treatment of Binge Eating Disorder or Bulimia Nervosa : A Systemic Review of Human Clinical Studies and Case Reports)

  • 이유정;방준석
    • 한국임상약학회지
    • /
    • 제17권1호
    • /
    • pp.6-12
    • /
    • 2007
  • 지난 20 여 년 간 서구 선진사회에서는 식사장애(Eating disorder) 중에서 신경성 폭식증(Bulimia nervosa)의 발병률이 급격히 상승하였고, 우리나라는 특히 젊은 여성층에서 발병률이 빠르게 상승하고 있다. 치료약물로는 주로 항우울제가 선택되지만, 치료효과가 미흡한 바, 항경련제인 topiramate가 효과가 있다는 보고들이 있어 이를 신경성 폭식증치료에 적극 사용할 수 있는가에 관심이 고조되었다. 본 연구는 topiramate가 지닌 신경성 폭식증 치료효과에 대한 최신 지견을 얻고자, 1990년부터 2006년 사이 MEDLINE과, 한국의학논문데이터베이스에 등재된 국내외 자료를 binge eating disorder, bulimia nervosa, topiramate라는 3개의 주요어휘로 검색하여 추출한 자료중에서, 대조군이 사용된 무작위 배정, 이중맹검 임상연구 및 치험사례 만을 선별하여 임상적유용성을 평가하였다. 국외 임상연구 및 치험사례에 따르면, topiramate가 신경성 폭식증에 수반되는 유해한 증상의 발생빈도를 경감시키는데 유효함을 나타내었다. 국내에는 아직 topiramate의 신경성 폭식증 치료효과를 검증한 체계화된 임상연구나 치험사례가 보고된 바 없었다. 피험자의 규모가 작다는 한계에도 불구하고, 일일 투여량 25 mg로 시작하여 점차 증량후 최대 600 mg까지 투여한 국외의 연구결과는, topiramate가 신경성 폭식증 치료에 유효한 결과를 보인다고 사료되므로, 국내 신경성 폭식증 임상치료와 연구에 반영되기를 기대한다.

  • PDF

한글 단어 재인에 영향을 미치는 변인: 음절 형태를 중심으로 (Variables affecting Korean word recognition: focusing on syllable shape)

  • 민수영;이창환
    • 인지과학
    • /
    • 제29권4호
    • /
    • pp.193-220
    • /
    • 2018
  • 시각 단어 재인에 영향을 미치는 변인으로는 단어 빈도, 단어 길이, 이웃단어, 단어 형태 등이 밝혀진 바 있다. 단어 형태 변인은 한글이 영어와는 글자 체계가 다르기 때문에 형태 정보가 단어 처리에 다른 방식으로 영향을 미칠 수 있다. 본 연구는 게스탈트의 연속성 원리를 한글에 적용하여 한글 단어의 처리 단위를 알아보고, 음절 형태가 한글 단어 재인에 영향을 미치는지 검증하고자 하였다. 실험 1에서는 3음절 단어를 사용하여 음절 유형(평소 읽기방향이 연속성 원리에 부합하는 '가로집자'형(예: "가"), 부합하지 않는 '세로집자'형(예: "고")과 글자 제시 방향(가로, 세로)을 조작하였다. 어휘 판단 시간의 분석 결과, 제시 방향에 상관없이 '가로집자'형의 처리 속도가 '세로집자'형보다 빨랐다. 실험 2에서는 차폐 점화를 사용하여 음절유형('가로집자'와 '세로집자'형) 및 점화 자극과 목표 자극의 시각적 관계(동일, 유사, 상이)를 조작하였다. 점화자극과 목표자극의 음절집자 형태에 따라서 수행에 차이가 있었으며 이는 음절 형태가 단어 재인에 미친다는 것을 시사한다.

단어재인에 미치는 연상과 심상성의 영향 (Effects of Association and Imagery on Word Recognition)

  • 김민정;이승복;정범석
    • 인지과학
    • /
    • 제20권3호
    • /
    • pp.243-274
    • /
    • 2009
  • 단어재인에 영향을 미치는 세 변인으로 연상, 단어 사용빈도, 심상성을 들 수 있다. 본 연구는 심상성이 단어재인에 미치는 영향을 살펴보고 심상성의 효과를 설명하는 두 가지 이론(이중 부호화 이론, 맥락 가용성 모델)을 검증하고자 하였다. 대학생 실험 참가자에게 연상 강도와 심상성을 통제한 단어 쌍을 제시하고 어휘판단 과제를 수행하게 하였다. 세 실험에서 과제의 점화자극 제시시간을 각각 달리하여 점화자극 제시시간에 따라 변화하는 두 변인의 효과 및 상호작용 효과를 관찰하였다. 점화자극 제시시간이 가장 짧은(20ms) 실험 1에서는 심상성의 주효과만 통계적으로 유의미 하였으며, 연상 강도가 영향을 미치지 못한 단어재인의 초기시점부터 심상성의 효과가 나타남을 확인하였다. 실험 2에서는 점화자극 제시시간을 50ms로 하였다. 결과, 연상 강도의 주효과와, 심상성의 주 효과, 두 변인의 상호작용 효과가 모두 관찰되었다. 실험 3에서는 점화자극을 비교적 길게(450ms) 제시하였다. 결과, 연상 강도의 주효과만 유의미하게 나타났다. 세 실험에서 모두 전반적으로 이중 부호화 이론의 설명과 일치하는 결과를 얻었다. 이중 부호화 이론의 경우 독립적으로 나타나는 심상성의 효과(예: 실험 1, 2)만을 설명하고 있으며, 맥락 가용성 모델은 독립적으로 나타나는 의미맥락의 효과(예: 실험 3)만을 설명하고 있다. 따라서 두 변인이 단어재인에 미치는 시간적 맥락과 그 영향의 크기를 적절히 고려한 통합된 이론이 요구된다는 점을 논의하였다.

  • PDF