• 제목/요약/키워드: 사전선별

검색결과 144건 처리시간 0.026초

예외 단어 선별 작업을 이용한 자동 발음열 생성 시스템의 성능향상에 관한 연구

  • 안주은;김선희;김순협
    • Proceedings of the KSLP Conference
    • /
    • 대한음성언어의학회 2003년도 제19회 학술대회
    • /
    • pp.142-142
    • /
    • 2003
  • 본 연구는 텍스트 분석 기반 자동 발음열 생성 시스템의 성능을 향상시킬 수 있는 방법으로 예외 단어 선별 작업을 제안한다. 제안하는 자동 발음열 생성 시스템은 형태음운 규칙 적용, 예외 규칙 적용, 일반음운 규칙 적용의 순서로 이루어진다. 이 때 예외 규칙은 예외사전을 검색하여 해당 어휘가 있을 때에만 적용하게 되는데, 예외 단어는 일정한 예외 환경에서만 나타난다. 본 시스템의 예외 사전에 있는 예외 단어는 5만여 어휘 연세사전에서 예외 환경에 해당하는 28,486개의 어휘 중, 총 2,931개의 예외 단어를 선별하였다. 본 시스템의 성능 평가는 ETRI 2,385, PBS 1,637 어절을 사용하였는데 실험 결과 각각 99.8%, 99.9%의 정확도를 보였고, 0.1% 의 오류는 예외 규칙 중에 하나인 어휘적 경음화 현상에서 나타났다. 따라서 예외 사전을 보다 정확하게 만드는 방법인, 예외 단어 선별 작업을 통해 본 시스템의 성능을 향상시킬 수 있다. (중략)

  • PDF

An Implementation Method of Platform for Wireless Internet Content Selection (무선 인터넷 내용 선별을 위한 플랫폼의 구현 방법)

  • Lee Won-Bok;Yang Jin-Hyuk;Kim Tae-Suk;Lee Ji-Yoon;Chung In-Jeong
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 한국정보처리학회 2004년도 추계학술발표논문집(상)
    • /
    • pp.785-788
    • /
    • 2004
  • 인터넷의 범주는 기존의 유선망에 국한하지 않고 무선망에서도 영향력을 넓혀 가고 있다. 그런 상황에서 유선 인터넷에서 나타난 유해정보의 무분별한 유입에 대한 문제들이 무선 인터넷으로 확산되고 있다. 인터넷 내용선별 체계(Platform for Internet Content Selection: PICS)는 인터넷 컨텐츠를 선별적으로 달 수 있게 해주는 기반구조로서, 선별 소프트웨어와 등급 서비스들 간에 잘 동작할 수 있게 도와주는 기술규격이다. 그러나 기존 PICS 관련기술들은 유선 환경만을 언급하고 있기 때문에 무선 환경에 맞는 내용선별 기술이 필요하다. 따라서 우리는 사전 연구를 통해 무선 환경에 PICS를 적용할 수 있다는 것을 보였고 이론적인 도입 방안을 제시하였다. 본 논문에서는 무선 인터넷 서비스 환경에서 PICS 도입을 위해 고려해야할 사항을 살펴보고 사전 연구를 통해 제시된 방안을 구현함으로서 검증한다.

  • PDF

Selective Operating Preamplifier Circuit for Low Voltage Static Random Access Memory (저전압 에스램용 선별 동작 사전 증폭 회로)

  • Jeong, Hanwool
    • Journal of IKEEE
    • /
    • 제25권2호
    • /
    • pp.309-314
    • /
    • 2021
  • The proposed preamplifier for the static random access memory reduces the time required for the sense amplifier enable during the read operation by 55%, which leads to a significant speed up the total spped. This is attirbuted to the novel circuit techqniue that cancels out the transistor mismatch which is induced by the process variation. In addition, a selective enable circuit for preamplifier circuit is proposed, so the proposed preamplifier is enabled only when it is required. Accordingly the energy overhead is limited below 4.45%.

A Mathematical Model to Evaluate the Radiological Risks for the Reuse of Decommissioning Site (원자력시설 해체부지의 재이용을 위한 방사선학적 리스크 평가모델)

  • Cheong, Jae-Hak
    • Journal of Nuclear Fuel Cycle and Waste Technology(JNFCWT)
    • /
    • 제4권4호
    • /
    • pp.353-363
    • /
    • 2006
  • In order to evaluate the potential radiological risks for the reuse of the site after decommissioning of nuclear facilities, a mathematical model was developed and materialized into the Microsoft $Excel{\circledR}$ spreadsheets frame. A set of input parameter values was proposed, which is useful in the preliminary risk screening step before the detailed evaluation with the site-specific data. It appeared that the screening levels calculated by the present model was agreed with the derived concentration guideline limits resulted from RESRAD Ver.6.2 and the German dose criteria for releasing a nuclear site from regulatory control.

  • PDF

Sentiment lexicon modeling for consumer analysis (소비자 분석을 위한 감성사전 모델링)

  • Lee, Jae-Woong;Yun, Hyun-Noh;Moon, Nammee
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 한국정보처리학회 2017년도 춘계학술발표대회
    • /
    • pp.850-853
    • /
    • 2017
  • 본 논문은, 크롤링을 통해 얻은 비정형 데이터를 'Python'의 'KoNLPy' 라이브러리를 사용해 형태소 분석한 후 텍스트 마이닝을 통한 감성사전 구축을 목표로 하고 있으며, 형태소들의 빈도수를 기반으로 가중치로 두어 선별된 단어들을 이용해 긍정과 부정으로 나누어 카테고리화 한다. 이후, 선별한 카테고리에 단어의 극성을 판단하여 감성사전을 모델링한다. 실험을 위하여, 온라인 쇼핑몰 리뷰를 크롤링하여 비정형 데이터를 수집하고, 수집한 데이터를 분석, 가공 과정을 거쳐 정형화된 단어를 추출한다. 그 후에, 리뷰에 자주 사용되는 단어를 바탕으로 카테고리를 구성하였다. 구성된 카테고리 별로 단어의 극성을 판단하여 소비자 성향을 분석한 결과, 단순히 긍정과 부정을 표현하는 범용 감성사전보다 더 세분화된 감성 사전을 구축 할 수 있었다.

Domain-agnostic Pre-trained Language Model for Tabular Data (도메인 변화에 강건한 사전학습 표 언어모형)

  • Cho, Sanghyun;Choi, Jae-Hoon;Kwon, Hyuk-Chul
    • Annual Conference on Human and Language Technology
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.346-349
    • /
    • 2021
  • 표 기계독해에서는 도메인에 따라 언어모형에 필요한 지식이나 표의 구조적인 형태가 변화하면서 텍스트 데이터에 비해서 더 큰 성능 하락을 보인다. 본 논문에서는 표 기계독해에서 이러한 도메인의 변화에 강건한 사전학습 표 언어모형 구축을 위한 의미있는 표 데이터 선별을 통한 사전학습 데이터 구축 방법과 적대적인 학습 방법을 제안한다. 추출한 표 데이터에서 구조적인 정보가 없이 웹 문서의 장식을 위해 사용되는 표 데이터 검출을 위해 Heuristic을 통한 규칙을 정의하여 HEAD 데이터를 식별하고 표 데이터를 선별하는 방법을 적용했으며, 구조적인 정보를 가지는 일반적인 표 데이터와 엔티티에 대한 지식 정보를 가지는 인포박스 데이터간의 적대적 학습 방법을 적용했다. 기존의 정제되지 않는 데이터로 학습했을 때와 비교하여 데이터를 정제하였을 때, KorQuAD 표 데이터에서 f1 3.45, EM 4.14가 증가하였으며, Spec 표 질의응답 데이터에서 정제하지 않았을 때와 비교하여 f1 19.38, EM 4.22가 증가한 성능을 보였다.

  • PDF

양계장 증$\cdot$$\cdot$신축, 사전환경성검토에 묶여 진퇴양난

  • 대한양계협회
    • KOREAN POULTRY JOURNAL
    • /
    • 제33권12호통권386호
    • /
    • pp.93-95
    • /
    • 2001
  • 충남 연기군에서 채란업에 종사하는 L사장은 최근 농장부지에 연접하여 계란 선별장 및 보관창고 200평을 신축을 허가 받기 위하여 군청에 들렀다가 환경보호과 직원으로부터 사전환경성검토를 받아야 신축허가가 가능하다는 말을 듣고 사전환경성검토를 받기 위한 준비중이다. 그러나 사전환경성검토 같은 환경정책은 양계인에게는 생소한 분야이고 보니 L 사장도 이에 대한 전문지식이 없어 어려움을 겪고 있다. 앞으로도 다른 양계 농가에서도 이와 같은 사례가 많을 것으로 판단되어 사전환경성 검토에 대하여 알아본다.

  • PDF

Brief Overview of Deep Learning based Anomaly Detection for Smart Surveillance System (스마트 관제를 위한 딥러닝 기반 이상행동 기술 동향 분석)

  • Lee, Jiae;Mun, Sungchul
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 한국방송∙미디어공학회 2019년도 추계학술대회
    • /
    • pp.14-16
    • /
    • 2019
  • 스마트관제 시스템은 딥러닝 서버내 학습된 백본 네트워크 모델이 실시간으로 스트리밍 되는 CCTV 영상으로부터 이상행동 패턴을 선별적으로 탐지하고 관제요원에게 전달하여, 사전에 사건사고를 예방하거나 즉시 대응 체계의 유연한 운영을 가능케하는 시스템이다. 최근 지능형 CCTV(Closed Circuit Television) 서비스가 일부 지역에 선별 관제의 형태로 시범적으로 운영되고 있는 상황이다. 지능형 시범서비스는 공공 영역에서 선별 CCTV 관제의 형태로 이상행동 상황을 즉각 인지하여 사건사고를 예방하거나 피해를 최소화하고자 하는 목적으로 주로 사용되고 있다. 그러나, 범죄 등의 특정 시나리오에만 한정해서도 이상 행동 유형이 너무나 다양하기 때문에 이상행동 영상의 사전분류(Annotation)를 통해 딥러닝 모델을 학습시키는 것이 현실적으로 어려운 상황이다. 따라서 본고에서는 최신 이상 행동 탐지(Anomaly detection) 알고리즘과 응용사례를 분석하여 실제 현장에 적용할 수 있는 현장 중심의 기법을 제안하고자 한다.

  • PDF

A Basic Study on the Recycling of Dredged Sewage Sediment (하수도 준설토 재활용에 관한 기초 연구)

  • Kim, Hong Min;Choi, Yun Jeong;Yoon, Seok-Pyo;Kim, Jun Kyoung
    • Journal of the Korea Organic Resources Recycling Association
    • /
    • 제26권3호
    • /
    • pp.33-37
    • /
    • 2018
  • In order to recycle sewage dredging soil, we analyzed particle size distribution and organic content of dredged sewage sediments. Based on this, it was determined that particles with relatively low organic content of 1.0 mm or more could be recycled as fine aggregate. Although it was inorganic at the size of 5 mm or more, it contained a number of foreign substances other than fine aggregate, which were needed to be removed with a sieve. Since there are volatile suspended solids between 1.0 and 5.0 mm size, they were removed by means of flotation. Fine aggregate was obtained from dredging soil by screening followed with flotation method, and the proportion of fine aggregate obtained in this study was around 38 %.