• 제목/요약/키워드: 한자검색

검색결과 29건 처리시간 0.028초

국내(國內) 문헌정보(文獻情報) 검색(檢索)을 위한 키워드 자동추출(自動抽出) 시스템 개발(開發) (Automatic Keyword Extraction System for Korean Documents Information Retrieval)

  • 예용희
    • 정보관리연구
    • /
    • 제23권1호
    • /
    • pp.39-62
    • /
    • 1992
  • 본(本) 연구(硏究)는 실제의 데이터 분석(分析)을 통하여 60여개의 조사(助詞)와 출현빈도는 높지만 검색(檢率)에 불필요한 320여개의 불용어(不用語)를 선정하여 좌우절단을 적용한 네 가지 유형으로 분류하고 조사(助詞)와 불용어 테이블을 구성하는 방법(方法)을 제시한다. 한글문헌에서 단어(單語)가 추출되면 조사의 효율적인 절단이 이러우지고, 한자어(漢字語)일 경우 한글로 변환되며, 2단계로 불용어제거(不用語除去) 과정을 거쳐 키워드를 선정하는 시스템을 개발한다. 여기서 추출된 키워드는 정보전문가(情報專門家)에 의해 추출된 색인어(索引語)와는 92.2%의 일치율을 보였다. 그리고 $4{\sim}6$글자로 구성된 복합어(複合語)의 경우 본(本) 연구(硏究)에서 제시한 분리방법에 의해 약 2배의 새로운 단어(單語)를 추가할 수 있었으며 그 중 58.8%가 키워드로 적합했다.

  • PDF

웹 상에서의 특정 장르 문서 발견 (Discovery of Genre Information on the Web)

  • 주원균;맹성현
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1999년도 제11회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.28-35
    • /
    • 1999
  • 정보공유를 목적으로 제안된 웹의 활성화와 함께 유용한 정보들이 웹상에 기하급수적으로 등장함에 따라 정보공간의 확장으로 인한 검색 신뢰도의 저하 문제에 직면하게 되었다. 본 연구에서는 대용량 웹 환경하에서 사용자의 정보발견을 돕기 위해 텍스트이외의 새로운 요소들을 사용하여 특정장르문서를 발견하는 개념을 도입하였다. 먼저 사용자가 발견하고자 하는 장르의 모습을 텍스트, URL정보, 링크 정보. 문서구조 정보 등의 장르 식별요소 값을 이용해 표현한 후, 후보 문서들의 장르관련도를 측정함으로써 특정장르 문서를 검색한다. 각 장르식별요소값은 나름대로의 방법에 의해 계산되는데 $0{\sim}1$사이의 값을 가지며, 종합적인 장르관련도는 각 장르식별요소값의 증거통합 방법에 의해 구한다. 본 논문에서는 각 장르식별요소들의 역할과 장르식별요소가 장르발견에 미치는 영향을 알아보며, 최종적으로 특정 장르 문서발견에 있어서의 검색 신뢰도 향상을 보이기 위해 실험모델을 설계/구현하였다. 본 실험은 웹 문서를 대상으로 하는데, 아직까지 URL, 링크 정보를 모두 갖춘 테스트컬렉션이 없기 때문에 실험을 위해 일반적인 웹 문서로 직접 구성한 컬렉션을 사용하였다. 발견하고자 하는 장르는 "컴퓨터 분야의 컨퍼런스 홈페이지"로 정하였으며 30개의 컴퓨터 분야를 선정하였다. 비교대상으로는 일반 웹 검색 엔진인 알타비스타와 메타검색 엔진인 메타크롤러를 선택하였고. 각 질의에 대해 상위 30개의 결과를 대상으로 정확도를 평가하였다. 결과로서 각 장르식별요소들은 모두 검색 신뢰도의 향상에 기여를 하며, 제안하는 방법은 알타비스타와 메타크롤러에 비해 각각 평균적으로 67.34%, 71.78%의 검색 신뢰도 향상을 보임을 입증하였다.적응에 문제점을 가지기도 하였다. 본 연구에서는 그 동안 계속되어 온 한글과 한잔의 사용에 관한 논쟁을 언어심리학적인 연구 방법을 통해 조사하였다. 즉, 글을 읽는 속도, 글의 의미를 얼마나 정확하게 이해했는지, 어느 것이 더 기억에 오래 남는지를 측정하여 어느 쪽의 입장이 옮은 지를 판단하는 것이다. 실험 결과는 문장을 읽는 시간에서는 한글 전용문인 경우에 월등히 빨랐다. 그러나. 내용에 대한 기억 검사에서는 국한 혼용 조건에서 더 우수하였다. 반면에, 이해력 검사에서는 천장 효과(Ceiling effect)로 두 조건간에 차이가 없었다. 따라서, 본 실험 결과에 따르면, 글의 읽기 속도가 중요한 문서에서는 한글 전용이 좋은 반면에 글의 내용 기억이 강조되는 경우에는 한자를 혼용하는 것이 더 효율적이다.이 높은 활성을 보였다. 7. 이상을 종합하여 볼 때 고구마 끝순에는 페놀화합물이 다량 함유되어 있어 높은 항산화 활성을 가지며, 아질산염소거능 및 ACE저해활성과 같은 생리적 효과도 높아 기능성 채소로 이용하기에 충분한 가치가 있다고 판단된다.등의 관련 질환의 예방, 치료용 의약품 개발과 기능성 식품에 효과적으로 이용될 수 있음을 시사한다.tall fescue 23%, Kentucky bluegrass 6%, perennial ryegrass 8%) 및 white clover 23%를 유지하였다. 이상의 결과를 종합할 때, 초종과 파종비율에 따른 혼파초지의 건물수량과 사료가치의 차이를 확인할 수 있었으며, 레드 클로버 + 혼파 초지가 건물수량과 사료가치를 높이는데 효과적이었다.\ell}$ 이었으며 , yeast extract 첨가(添加)하여 배양시(培養時)는 yeast extract 농도(濃度)가 증가(增加)함

  • PDF

가상문서를 개념을 활용한자기 주도적 학습지원 시스템의 설계 및 구현 (Design and Implementation of Supporting System of a Self-Directed Learning using Virtual Document Concept)

  • 노진순;이용배;맹성현
    • 정보교육학회논문지
    • /
    • 제6권2호
    • /
    • pp.234-245
    • /
    • 2002
  • World-Wide Web으로 인하여 인터넷상의 다양하고 고품질의 자료들을 교육용으로 손쉽게 활용할 수 있는 시대가 도래하였다. 그러나 이와 같은 자료들은 교육적 효과를 극대화시키기 위해서 좀 더 정제되고, 교육과정에 맞는 흐름을 가질 필요가 있다. 따라서 이러한 흐름 제공을 위해서는 웹 상에서 분산되어 독립적으로 존재하는 디지털 문서들을 교육 목적에 맞게 새로운 순서, 즉 문맥화 된 순서를 가진 자료로 재구성할 수 있어야 하고, 이와 같이 재구성된 자료들은 문서간의 부드러운 내용 전개를 위해서는 부가적인 설명이나 기존 문서에 빠져 있는 내용들을 보완할 수 있어야 한다. 본 논문에서는 인터넷상의 수많은 리소스들을 재가공하여 교육과정에 맞는 흐름을 부여하기 위하여 가상문서 개념을 도입하였다. 이와 같이 저작된 가상문서를 이용하여 검색엔진의 형태로 학습자에게 제공함으로써 학습자의 수준과 목적에 맞는 문서를 검색하여 학습할 수 있는 자기 주도적 학습을 유도하려고 한다.

  • PDF

PDA상에서의 한글 필기체 매칭 알고리즘 (A Hangul Script Matching Algorithm for PDA)

  • 조미경;조환규
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권10호
    • /
    • pp.684-693
    • /
    • 2002
  • 전자 잉크 데이터는 펜 기반 컴퓨터나 PDA(Personal Digital Assistants)등에서 자연스럽고 편리한 데이터 입력을 제공하기 위해 펜으로 입력한 데이터를 온라인 문자 인식기를 이용하여 아스키 문자로 변환하지 않고 스크립트 형태로 저장하는 데이터를 말한다. 전자 잉크 데이터를 사용하기 위해 가장 중요한 것 중 하나는 전자 잉크 데이터의 검색 문제이다. 본 연구에서는 전자 잉크 데이터를 획 특징 벡터 형태로 저장하고, 이를 이용해서 잉크 데이터를 검색하는 매칭 알고리즘을 제안하고 구현하였다. 제안된 매칭 알고리즘은 입력된 데이터를 곡률(curvature)을 이용하여 기본획(primitive stroke)으로 분리하고 기본획의 종류를 결정한 다음 획 특징 벡터를 생성한다. 그리고 동적 프로그래밍 기법에 의해 획 특징 벡터의 거리값을 계산한다. 제안된 매칭 알고리즘을 이용하여 다양한 실험을 하였으며 한글 스크립트로 구성된 경우 97.7%이상의 매칭률을 보여 주었고 한글 및 한자 흔합 스크립트에서는 94%이상의 매칭률을 보여 주였다.

낙관 인식을 위한 애플리케이션의 설계 및 구현 (Design and Implementation of Luo-kuan Recognition Application)

  • 김한슬;서귀빈;강민구;류기수;홍민
    • 인터넷정보학회논문지
    • /
    • 제19권1호
    • /
    • pp.97-103
    • /
    • 2018
  • 대부분의 동양화 작품에는 작가의 정보를 압축시켜 하나의 그림으로 표현한 낙관이 존재하고 이러한 낙관은 작품의 제목이나 작가의 이름 등 다양한 정보를 포함하고 있다. 따라서 동양화를 수집하거나 즐기는 사람들에게 낙관은 동양화에 대한 중요한 정보를 제공하는 단서 역할을 한다. 하지만 낙관에 있는 글자들은 대부분 어려운 한자나 간자 혹은 다양한 모양으로 변형되어 있어 일반인들이 쉽게 해석하기 어려운 문제점이 있다. 본 논문에서는 낙관의 정보를 손쉽게 확인할 수 있도록 안드로이드 기반의 낙관 검색 애플리케이션을 개발하였다. 해당 애플리케이션은 촬영한 낙관 이미지를 분석하여 서버에 전송해 서버 내의 데이터베이스에서 촬영한 낙관 사진과 가장 유사한 낙관 후보에 대한 정보를 검색하는 알고리즘을 적용하였다. 또한 제안하는 알고리즘의 성능 분석을 위해서 촬영된 낙관 사진과 170개의 낙관 데이터 후보 중에서 정확하게 낙관을 찾아내는지에 대한 여부와 제공되는 낙관의 순위를 바탕으로 알고리즘의 정확도를 비교 및 분석하였다. 정확도 분석 실험 결과 본 애플리케이션의 검색 알고리즘의 정확도는 약 90%로 확인되었으며 추후 알고리즘의 최적화와 멀티쓰레딩 알고리즘의 보완을 통해 빅 데이터 환경에서 자동으로 이미지를 분석 및 검색하는 플랫폼으로의 발전이 가능할 것으로 기대한다.

계몽기·근대시조 DB의 개선 및 콘텐츠화 방안 연구 (A study on the improving and constructing the content for the Sijo database in the Period of Modern Enlightenment)

  • 장정수
    • 한국시조학회지:시조학논총
    • /
    • 제44권
    • /
    • pp.105-138
    • /
    • 2016
  • 최근 검색 기능을 갖춘 "계몽기 근대시조의 XML 데이터베이스 문서화"라는 자료가 기초학문자료센터(http://www.krm.or.kr)를 통해 제공되고 있어 근대시조의 문화콘텐츠화를 진행할 수 있는 기반이 마련되었다. 이에 본고에서는 계몽기 근대시조 DB의 특성 및 문제점을 검토해 보고 개선 방향을 탐색함으로써 이 자료의 콘텐츠화 방안을 모색해 보았다. 계몽기 근대시조 DB는 12,500여 수에 이르는 방대한 양의 근대시조를 한자리에서 일별할 수 있도록 집성해 놓았다는 점과 문헌 및 작가명 작품명 검색, 원문 검색, 시기별 검색 등의 검색 기능을 갖춘 최초의 시조 DB라는 점에서 의의를 지닌다. 그러나 이 DB는 현대어 정규화 텍스트가 형성되지 않아 제목이나 원문이 고어나 한자로 표기되어 있는 경우 검색이 되지 않으며, 1945년 이후에 발표된 작품과 개인 시조집에 수록된 작품이 대거 누락되어 있어 계몽기 근대시조의 총체적 모습을 확인하는 데에 한계가 있다는 문제점을 지니고 있다. 또한 작자 표시가 실명, 호, 필명 등으로 다양하게 표기되어 있어 작가별 자료 추출에 불편함이 따르는 문제가 있다. 이러한 문제점을 해결하고 DB 활용을 제고(提高)하는 방안으로 본고에서는 현대어 정규화 텍스트 마련, 작품 별 내용소(內容素) 색인어 부여, 고시조 DB와의 통합, 작품 형식에 대한 정보 제공 등을 제시하였다. 나아가 '시조문화정보시스템'의 성격을 갖춘 복합적인 성격의 계몽기 근대시조 DB가 형성된다면 이를 연구 및 교육콘텐츠로 활용할 수 있음을 피력하였다. 그 구체적인 방안으로는 근대사 학습 및 근대기 국토 인식 등에 대한 보조 자료, 고유의 동식물 캐릭터 학습 및 상업적 캐릭터 생성을 위한 원천 자료, 시조놀이 등의 시조학습 도구로 활용할 수 있음을 제안하였다.

  • PDF

스팸 필터링을 위한 지식 그래프 기반의 신조어 감지 매커니즘 (Knowledge Graph-based Korean New Words Detection Mechanism for Spam Filtering)

  • 김지혜;정옥란
    • 인터넷정보학회논문지
    • /
    • 제21권1호
    • /
    • pp.79-85
    • /
    • 2020
  • 오늘날 스마트폰에서 스팸 문자를 차단하기 위해 문자 내용과 스팸 키워드의 단순 문자열 비교 또는 스팸 전화번호를 차단하는 방식을 사용하고 있다. 이에 따라 스팸 문자가 자동으로 차단되는 것을 방지하기 위해 점차 변화된 방식으로 스팸 문자를 전송한다. 특히 스팸 키워드에 포함되는 단어의 경우 단순 문자열 비교로 검색되지 않도록 특수문자, 한자, 띄어쓰기 등을 이용하여 비정상적인 단어로 스팸 문자를 발송한다. 기존 스팸 필터링 방식의 경우 이러한 스팸 문자를 차단할 수 없다는 한계가 있다. 따라서 변화하는 스팸 문자에 대응할 수 있는 새로운 기술이 필요한 시점이다. 본 논문에서는 스팸 문자에서 자주 사용되는 신조어를 검출하여 변화하는 스팸 문자에 대응할 수 있는 지식 그래프 기반의 신조어 감지 매커니즘을 제안한다. 또한 기본 Naive Bayes에 감지한 신조어를 적용하여 제안한 방법의 성능 실험 결과를 보여준다.

블랜디드러닝(Blended Learning)활용방안 - NHK「NEWS WEB EASY」를 중심으로 - (Utilization Plan of Blended Learning - Focused on NHK「NEWS WEB EASY」-)

  • 유미선
    • 한국융합학회논문지
    • /
    • 제10권5호
    • /
    • pp.119-124
    • /
    • 2019
  • 본 연구의 목적은 일본어 중급 단계 학습자들에게 NHK"NEWS WEB EASY"라는 온라인 사이트를 소개하고, 오프라인 수업에서 "NEWS WEB EASY"의 기사를 활용한 수업설계방안을 통해 블랜디드러닝의 효과적인 방법을 제안하는 것이다. 본고에서는 "NEWS WEB EASY"를 활용한 블랜디드러닝을 통하여 첫째, 다양한 어휘 학습능력을 배양하고. 둘째, 다양한 분야의 기사를 통해 일본문화 및 일본사정을 익히고. 셋째, 기사별 리스닝 파일을 통해 자연스럽게 리스닝 트레이닝을 실시하고, 넷째, 후리가나가 없는 파일을 학습자들에게 배포, 검색하게 함으로 한자 읽기연습 및 어휘실력 향상에 도움을 주고. 다섯째, 낭독연습을 통하여 스피킹 실력을 향상시키는 방법에 대하여 제시하였다. "NEWS WEB EASY"를 활용한 학습을 통해 어렵다는 선입견으로 접할 수 없었던 뉴스기사를 학습함에 따라 일본을 이해하고 일본어 실력향상에 많은 도움이 되었다는 사실을 알 수 있었다.

급성 심근경색증 환자에서 시행한 OPCAB의 수술시기와 검색의 정도에 따른 임상성적 (Clinical Results and Optimal Timing of OPCAB in Patients with Acute Myocardial Infarction)

  • 윤영남;양홍석;심연희;유경종
    • Journal of Chest Surgery
    • /
    • 제39권7호
    • /
    • pp.534-543
    • /
    • 2006
  • 배경: 급성심근경색증 환자에서 수술 시기는 아직도 논란이 많으며, off pump coronary artery bypass grafting (OPCAB)은 심폐체외순환의 부작용을 피할 수 있다는 장점이 있지만 급성심근경색증에 있어서 OPCAB의 효용성은 아직 입증되지 않았다. 저자들은 급성심근경색증 환자들에서 시행한 OPCAB의 수술시기와 경색의 정도에 따른 단기 및 중기 성적을 비교 분석하여 급성심근경색에 있어서 OPCAB의 적절한 수술시기와 효용성을 알아보고자 하였다. 대상 및 방법: 2002년 1월부터 2005년 7까지 OPCAB을 시행 받은 환자 중 수술 전 급성심근경색으로 진단되었던 126명을 대상으로 하였다. 환자들의 평균 연령은 61.2세였고, 남성이 92명(73.0%), 여성이 34명(27.2%)이었다 대상 환자 중 109명(86.5%)에서 3개 혈관 병변 혹은 좌주관상동맥 병변을 보였고, 긴급 또는 응급 수술을 요하는 환자는 25명(19.8%)이었다. 비전층 심근경색환자(제1군)는 72명(57.1%), 전층 심근경색한자(제2군)는 54명(42.9%)이었으며, 수술 전 심장성 쇼크와 대동맥 내 풍선펌프 삽입의 빈도는 제2군에서 더 높았으나 그 외의 수술 위험인자의 유병률은 차이가 없었다. 급성 심근경색이 발생한 후 수술까지의 시간을 각각 24시간 내, 1-3일, 4-7일, 8일 이후로 나누어 사망률 및 합병증을 비교하였다. 수술까지의 평균 대기 기간은 $5.3{\pm}7.1$일이었으며, 제1군은 $4.2{\pm}5.9$일, 제2군은 $6.6{\pm}8.3$일이었다. 결과: 환자당 평균 3.21개의 문합을 시행하였으며, 수술 후 3명에서 대동맥풍선펌프를 사용하였다. 제1군에서 1명 (0.79%)의 저심박출증에 의한 수술 사망이 있었으나, 심근경색이 새로 발생한 예는 없었다. 두 군간의 주 합병증의 발생률의 차이가 없었으며, 수술 대기시간에 따른 합병증의 발생률 차이도 없었다. 평균 추적관찰 기간은 21.3개월(2-42개월)이었으며, 추적 조사 결과, 42개월 전제 생존율은 $94.9{\pm}2.4%$로 제1군은 $91.4{\pm}4.7%$, 제2군은 $98.0{\pm}2.0%$로 두 군간의 통계적 유의성은 없었다(p=0.26). 심장관련 사망에 대한 42개월 전체 생존율은 $97.6{\pm}1.4%$로 제1군은 $97.0{\pm}2.0%$, 제2군은 $98.0{\pm}2.0%$로 두 군간의 통계적 유의성은 없었다(p=0.74). 심장 관련 합병증의 42개월 전체 자유도는 $95.4{\pm}2.0%$로 제1군은 $94.8{\pm}2.9%$, 제2군은 $95.9{\pm}2.9%$로 두 군간의 통계적 유의성은 없었다(p=0.119). 결론: 급성심근경색환자에서 대기 시간 없이 심폐체외순환기를 사용하지 않는 관상동맥우회술을 시행하여 좋은 중 단기 성적을 확인하였으며, 심근경색의 정도는 수술 성적에 영향을 미치지 않았다. 저자들은 급성심근경색의 치료로써 관상동맥우회술이 필요한 경우 대기시간 없이 OPCAB을 시행하여도 안전할 것이라고 생각한다. 그러나 이를 확인하기 위해서는 좀 더 많은 대상군과 전향적인 연구가 필요할 것이다.