• 제목/요약/키워드: 성능정보

검색결과 26,723건 처리시간 0.046초

위키피디아로부터의 자동 병렬 문장 추출 기법을 이용한 영어-한국어 교차언어 정보검색의 번역 성능 개선 (Improving Query Translation by Extracting Parallel Sentences from Wikipedia for Cross-Language Information Retrieval)

  • 천주룡;고영중
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2015년도 제27회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.35-40
    • /
    • 2015
  • 본 논문은 영어-한국어 교차언어 정보검색의 질의어 번역에 대한 중요한 자원으로 활용되는 병렬 말뭉치의 품질 향상을 위해서, 위키피디아의 비교 말뭉치로부터 자동으로 병렬 문장을 추출하여 활용하는 기법을 제안한다. 기존 연구에서 질의어 번역을 위해 위키피디아의 이중 어휘 사전 및 동의어, 다의어 정보를 구축하고, 기 기축된 병렬 말뭉치와 함께 활용하여 여러 의미를 가진 번역 후보 단어들 중, 최적의 단어를 선택하는 방법을 이용하고 있다. 여기서 활용되는 병렬 말뭉치는 질의어 번역에서 가장 중요한 자원이다. 하지만, 기 구축된 병렬 말뭉치는 양이 적거나, 특정 영역을 중심으로 구성되어 있는 문제가 있다. 이러한 문제를 해결하기 위해, 본 논문은 위키피디아로부터 자동 병렬 문장 추출 기법을 이용, 대량의 영어-한국어 간 병렬 말뭉치를 구축하고, 이를 교차언어 정보검색을 위한 질의어 번역에 적용하여 개선을 보인다. 실험의 성능 비교를 위해서 NTCIR-5 데이터를 이용하였으며 기 구축된 세종 병렬 말뭉치를 활용한 질의어 번역의 성능이 MAP 31.5%, R-P 33.0%에서, 새롭게 구축한 위키피디아 병렬 말뭉치를 활용한 질의어 번역의 성능이 MAP 34.6%, R-P 34.6%로, 각각 MAP 3.1%와 R-P 1.6%의 성능 향상을 보였다.

  • PDF

사전 학습 언어 모델을 활용한 감정 말뭉치 구축 연구 (A Study on the Construction of an Emotion Corpus Using a Pre-trained Language Model )

  • 장연지 ;비립 ;강예지 ;강혜린 ;박서윤 ;김한샘
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.238-244
    • /
    • 2022
  • 감정 분석은 텍스트에 표현된 인간의 감정을 인식하여 다양한 감정 유형으로 분류하는 것이다. 섬세한 인간의 감정을 보다 정확히 분류하기 위해서는 감정 유형의 분류가 무엇보다 중요하다. 본 연구에서는 사전 학습 언어 모델을 활용하여 우리말샘의 감정 어휘와 용례를 바탕으로 기쁨, 슬픔, 공포, 분노, 혐오, 놀람, 흥미, 지루함, 통증의 감정 유형으로 분류된 감정 말뭉치를 구축하였다. 감정 말뭉치를 구축한 후 성능 평가를 위해 대표적인 트랜스포머 기반 사전 학습 모델 중 RoBERTa, MultiDistilBert, MultiBert, KcBert, KcELECTRA. KoELECTRA를 활용하여 보다 넓은 범위에서 객관적으로 모델 간의 성능을 평가하고 각 감정 유형별 정확도를 바탕으로 감정 유형의 특성을 알아보았다. 그 결과 각 모델의 학습 구조가 다중 분류 말뭉치에 어떤 영향을 주는지 구체적으로 파악할 수 있었으며, ELECTRA가 상대적으로 우수한 성능을 보여주고 있음을 확인하였다. 또한 감정 유형별 성능을 비교를 통해 다양한 감정 유형 중 기쁨, 슬픔, 공포에 대한 성능이 우수하다는 것을 알 수 있었다.

  • PDF

++디스크 드라이브 레벨에서 힌트정보를 이용한 디스크 캐쉬 운영 방안 (Disk Cache Operating Strategy Using Hints in Disk Drive)

  • 조재동;장태무
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (3)
    • /
    • pp.27-29
    • /
    • 2000
  • 마이크로 프로세서의 동작 속도와 디스크 액세스 속도의 성능 차이는 컴퓨터 시스템의 성능을 제한하는 중요한 요인 주의 하나로 지적되고 있다. 이러한 격차를 줄이는 기술로 디스크 캐쉬의 운영이 연구되어 왔고 디스크 캐쉬 성능 개선 방법으로 선인출이 널리 연구되어 왔다. 본 논문에서는 디스크 드라이브 상에 구현된 캐쉬에서 디스크 요청에 대한 성격적 유형을 힌트로 이용한 선인출 적용방법을 제안하고, 제안된 방법의 유효성은 시뮬레이션 방식으로 입증하였으며 적응적으로 변경된 선인출 적용 방법이 성능의 개선을 이룰 수 있음을 보였다.

  • PDF

어플리케이션 튜닝을 통한 데이터베이스 시스템 성능 향상 (Application Tuning For Increased Database System Performance)

  • 이병헌;최용락;정기원
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
    • /
    • pp.187-189
    • /
    • 2001
  • 기존 시스템에서 보다 정확하고 신속한 정보의 제공에 대한 사용자들의 요구사항을 충족시키기 위해서는 시스템의 개선이나 현재 운영중인 시스템의 조율이 필수적으로 여겨지고 있다. 시스템 개발자는 관계형 데이터베이스 시스템의 성능을 저하 시키는 용인 중 응용 프로그램들과 저장 포로시저, 트리거, 패키지, 뷰 등에 대한 성능 향상을 위하여 튜닝을 고려하여야만 한다. 특히, 응용 어플리케이션 수행에 많은 시간을 소요하거나, 많은 자원을 필요로 하는 응용 프로그램들을 중심적으로 분석하여 적절한 튜닝을 수행한다. 또한, 오라클에서 제공하는 도구들을 이용하여 자료나 질의문의 특성을 파악한 후에 효과적인 개선을 통하여 데이터베이스 시스템의 성능 및 효율을 높이는 방법에 관심을 두고 있다.

  • PDF

ATM기반의 VDSL 집중화 장치의 구현과 성능 측정 (Implementation and Performance Measure of an ATM-Based VDSL Concentrator)

  • 정광모;민상원;김남영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (3)
    • /
    • pp.187-189
    • /
    • 2001
  • 사용자의 빠르고 좋은 서비스 욕구에 따라 점자 음성, 데이터, 영상을 포함하는 광대역 정보전달의 필요성을 가속화 시켰고 기술적 측면에서 전송기술, 교환기술, 서비스 기술 등 기존의 통신망의 인프라를 고급화가 이루어지고 있다. 본 논문에서는 이와 같은 사용자의 광대역에 대한 욕구를 가능하게 하는 VDSL (Very high bit-rate Digital Subscriber Line) 집중화 장치의 하드웨어와 소프트웨어 구조의 설계 및 구현과, 구현된 시스템의 VDSL 성능 측정에 대하여 기술하였다. 성능 측정 시험은 거리에 따른 전송속도의 성능을 고찰하였고 이 결과를 바탕으로 VoD (Video on Demand)시험을 하여 시스템 기능이 정상적으로 수행되는 것을 확인하였다.

  • PDF

오류 분석을 통한 파서의 성능향상 (Performance Improvement of Parser through Error Analysts)

  • 오진영;차정원
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2009년도 제21회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.213-218
    • /
    • 2009
  • 본 논문에서는 무제한 텍스트 입력이 가능한 파서에서 오류분석을 통한 성능 향상을 이루고자 한다. 우선 코퍼스로부터 자동학습에 의해서 구문 분석 모델을 만들고 이를 평가하여 발생하는 오류를 분석한다. 오류를 감소시킬 수 있는 언어 특성이 반영된 자질을 추가하여 성능을 향상시키고자 한다. 세종 코퍼스를 10-fold cross validation으로 평가할 때, 한국어의 특성을 반영한 자질 추가로 1%이상의 성능 향상을 이루었다.

  • PDF

암 분류를 위한 기계학습 분류기의 성능평가 (Performance Evaluation of Machine Learning Classifiers for Cancer Classification)

  • 원홍희;조성배
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 추계학술발표논문집 (상)
    • /
    • pp.405-408
    • /
    • 2002
  • Microarray 기술의 발전으로 많은 양의 유전자 정보를 얻게 되어 암의 정확한 분류와 진단에 대한 기대가 커지고 있다. 암을 정확하게 분류하기 위해서는 추출된 유전자에 많은 잡음이 들어가기 때문에 암과 관련이 있는 유전자만을 추출할 필요가 있다. 본 논문에서는 여러 가지 유전자 추출방법과 다양한 분류기의 성능을 체계적으로 평가하기 위하여, 세 가지 벤치마크 암 데이터에 대하여 실험하여 보았다. 또한 분류 성능을 향상시키기 위하여 분류기를 적절하게 결합한 결과, 결합된 분류기의 성능을 확인해볼 수 있었다.

  • PDF

배경 세선화를 이용한 한글 필기체 글자 단위 분할 (Handwritten Korean Character Segmentation using Background thinning)

  • 서원택;조범준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.823-825
    • /
    • 2004
  • 본 연구에서는 필기체 한글의 글자단위의 분할을 위해 배경 세선화(Background thinning)라는 방법을 제안한다. 배경 세선화 방법은 글자와 글자 사이에 존재하는 배경의 정보를 세선화 처리하여 필기체 한글에서 많이 발생할 수 있는 중첩(Overlap)글자와 연결(Touched)글자를 서로 분할하는데 효과적인 성능을 보였다. 배경 세선화를 이용하여 글자를 분할하는 방법은 인식과정의 판단을 필요하지 않은 외적분할 방법으로 빠른 속도의 분할 성능을 보였다. 이 방법은 특히, 중첩된 글자의 분할에 탁월한 성능을 보였을 뿐만 아니라, 연결된 글자에 대해서도 좋은 성능을 보였다.

  • PDF

부가파일을 이용한 실체 뷰 관리 기법의 성능평가 (Performance Evaluation on Materialized View Management using Differential Files)

  • 정웅교;김진호;이우기
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (1)
    • /
    • pp.268-270
    • /
    • 2001
  • 데이터웨어하우스내에서 실체뷰는 소스 데이터에서 갱신이 발생하였을 경우 질의에 정확한 결과를 제공하기 위하여 릴레이션의 변경사항과 동일하게 갱신되어야 한다. 이 뷰를 갱신할 때 전체 릴레이션이 아닌 갱신된 부분만 이용하여 점진적으로 뷰를 관리하는 것이 효과적이다. 뷰의 점진적인 갱신 방법중에서 부가화일을 이용한 방법은 부가적으로 유지하는 정보의 양이 적고 뷰 관리 비용이 적게 든다는 장점이 있다. 이 논문에서는 이 방법에 의해 뷰를 관리할 때의성능을 평가하기 위하여 이 방법의 비용 모델을 분석적으로 제시하였으며, 이 모델을 기반으로 성능을 비교, 분석하여 부가 파일을 이용한 방법이 다른 기존의 방법보다 성능이 우수함을 보였다.

  • PDF

성능 향상을 위한 J2EE 아키텍처 패턴 (J2EE Architecture Pattern For The Performance)

  • 김정덕;홍선주;최성운
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 춘계학술발표대회
    • /
    • pp.249-252
    • /
    • 2004
  • 컴포넌트 기반 개발은 소프트웨어의 생산성을 높이며 유연성, 확장성, 호환성, 상호운영성 높은 정보시스템을 구축한다. 하지만, 이러한 특성이 성능을 저하시키는 요인이 되기도 한다. J2EE 환경에서 3-tier 컴포넌트 조립방식의 웹 어플리케이션 개발 시 성능 향상을 가져오는 아키텍처 패턴을 제시한다. 또한 그 제시한 아키텍처 패턴을 기반으로 한 구현을 통한 응답시간을 측정해 성능 향상 결과를 제시한다

  • PDF