• 제목/요약/키워드: 말 산출

검색결과 192건 처리시간 0.027초

위키피디아로부터 한국어-영어 병렬 문장 추출 (Extracting Korean-English Parallel Sentences from Wikipedia)

  • 김성현;양선;고영중
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제41권8호
    • /
    • pp.580-585
    • /
    • 2014
  • 본 연구는 '위키피디아 데이터를 이용한 병렬 문장 추출'이라는 주제에 대해서, 기존에 해외에서 사용되었던 다양한 방법을 한국어 위키피디아 데이터에 실제로 적용해보고 그 결과를 정리하여 보고한다. 실험 방식은 두 가지로 나눌 수 있는데, 첫 번째는 번역 확률을 이용하는 방법으로 세종 병렬 말뭉치 등의 기존 자원으로부터 번역 확률을 추출하여 사용한다. 두 번째는 사전을 이용하는 방법으로, 위키피디아 타이틀로 구성된 위키 사전(Wiki dictionary)을 기본으로 하여, MRD(machine readable dictionary) 정보와 숫자 사전을 추가로 사용한다. 실험 결과, 기존 자원만 이용한 경우보다 위키피디아 데이터를 결합하여 사용한 경우에 매우 큰 폭의 성능 향상을 얻어, 최종적으로 F1-score 57.6%의 우수한 성능을 산출하였다. 또한 토픽 모델(topic model)을 이용한 실험도 추가로 수행하였는데, F1-score 51.6%로 최종 성능 면에서는 낮았지만 비지도 학습 방법이라는 장점을 고려할 때 추가 연구에 대한 여지가 있다고 볼 수 있다.

SOC투자평가시스템의 체계 및 설계개선 (Design Improvements of Investment Analysis System for SOC)

  • 이진선;남두희
    • 한국인터넷방송통신학회논문지
    • /
    • 제15권3호
    • /
    • pp.131-136
    • /
    • 2015
  • 타당성평가란 개별적인 공공교통시설 개발 사업을 본격적으로 착수하기 위하여 구체적으로 해당 사업계획을 수립하거나 기본설계를 추진하는 단계(이와 유사한 계획 또는 설계를 포함한다)에서 해당 개별사업을 대상으로 실시하는 것을 말한다. 주어진 자원을 효율적으로 배분하기위해 대안들에 대한 편익하고 경제성을 분석하여 최적의 대안을 산출하는 것을 말한다. 본 논문에서는 SOC평가체계의 중요한 부분인 타당성평가에서의 여러 요소들에 관한 연구방향과 미국일본의 사례분석을 제시한다. 기존의 비용편익분석과 더불어 미국, 일본의 평가기준을 살펴보았도 기존의 전통적인 통행시간 절감, 사고감소에 따른 편익뿐만이 아니라 사회적, 문화적 항목의 편익 등에 대한 연구가 활발하게 이루어 지고있음을 보였다. 특히, 존재가치, 집중효과 의 분석을 통하여 지역사회에 프로젝트가 미치는 영향을 사회적인 관접에서 계량화하는 노력들이 이루어 지고있어 이에대한 연구와 계량화에 대한 심도있는 연구가 필요하다.

트랜스포머 기반 효율적인 자연어 처리 방안 연구 (A Study on Efficient Natural Language Processing Method based on Transformer)

  • 임승철;윤성구
    • 한국인터넷방송통신학회논문지
    • /
    • 제23권4호
    • /
    • pp.115-119
    • /
    • 2023
  • 현재의 인공지능에서 사용되는 자연어 처리 모델은 거대하여 실시간으로 데이터를 처리하고 분석하는 것은 여러가지 어려움들을 야기하고 있다. 이런 어려움을 해결하기 위한 방법으로 메모리를 적게 사용해 처리의 효율성을 개선하는 방법을 제안하고 제안된 모델의 성능을 확인하였다. 본 논문에서 제안한 모델의 성능평가를 위해 적용한 기법은 BERT[1] 모델의 어텐션 헤드 개수와 임베딩 크기를 작게 조절해 큰 말뭉치를 나눠서 분할 처리 후 출력값의 평균을 통해 결과를 산출하였다. 이 과정에서 입력 데이터의 다양성을 주기위해 매 에폭마다 임의의 오프셋을 문장에 부여하였다. 그리고 모델을 분류가 가능하도록 미세 조정하였다. 말뭉치를 분할 처리한 모델은 그렇지 않은 모델 대비 정확도가 12% 정도 낮았으나, 모델의 파라미터 개수는 56% 정도 절감되는 것을 확인하였다.

일배체형 추론을 위한 후보군 간소화 알고리즘 (A New Algorithm of Reducing Candidate Haplotypes for Haplotype Inference)

  • 최문호;강승호;임형석
    • 한국정보통신학회논문지
    • /
    • 제17권7호
    • /
    • pp.1732-1739
    • /
    • 2013
  • 인간의 한쪽 염색체상에 나타나는 SNP의 서열인 일배체형을 식별해내면 효과적인 유전질병 연관검사를 할 수 있다. 일배체형 추론문제란 특정 집단의 유전자형 집합으로부터 집단에 속한 각 개체의 유전자형을 설명할 수 있는 일배체형 집합을 도출해내는 것을 말한다. 본 논문에서는 검약기반 일배체형 추론 문제에 대해 최종 결과에 기여하지 않는 일배체형 집합을 후보군에서 제외함으로써 일배체형 추론과정에서 탐색해야 할 후보 일배체형의 개수를 줄이는 사전처리 알고리즘을 제시한다. 제시된 알고리즘은 기존의 사전처리 알고리즘에 비해 매우 빠르게 수행되며, 제시된 사전처리 알고리즘의 결과를 적용한 일배체형 추론은 대다수의 경우에 최적해를 산출하고, 최적해를 산출하지 않는 경우에도 최적해의 일배체형 개수와 크게 차이나지 않음을 실험을 통해서 보인다.

작업의 효율성을 고려한 최적 플랫폼 위치 선정 방안 -굴삭기 제원에 따른 최적화- (Decision of Optimal Platform Location Considering Work Efficiency -Optimization by Excavator Specification-)

  • 이승수;박진웅;서종원;김성근
    • 한국건설관리학회:학술대회논문집
    • /
    • 한국건설관리학회 2008년도 정기학술발표대회 논문집
    • /
    • pp.790-793
    • /
    • 2008
  • 현재, 국토해양부 건설기술혁신사업의 일환으로 2006년 말부터 토공자동화를 위한 '지능형굴삭시스템개발'이 진행되고 있다. 지능형 굴삭시스템의 세부핵심요소기술 중, Task Planning System(TPS)은 토공 작업의 효율성, 안전성, 경제성 등을 고려하여 토공 설계데이터와 작업환경 인식기술에 근거한 작업환경 데이터를 분석하여 최적의 작업계획을 수립하는 시스템이다. 작업계획생성 시 효율적인 토공작업을 위해서는 플랫폼 생성 시 그 위치가 최적의 점을 형성하여 중첩되는 작업영역의 크기가 줄어들어 비효율적인 작업을 제거할 수 있으며 작업 시간을 최소화할 수 있고 굴삭작업의 생산성을 극대화찰 수 있다. 또한, 최적 플랫폼 위치 선정 시 굴삭기 제원에 따른 최적화가 되어야 굴삭기의 규격에 따른 로컬 영역의 산출 알고리즘과 호환이 될 수 있다. 본 논문은 영역 분할 과정에서 산출된 로컬영역을 기준으로 굴삭기 제원에 따른 최적화된 플랫폼 위치 선정 방안에 대하여 살펴보고 검증을 통하여 효율성을 판단하고자 한다.

  • PDF

제강슬래그 처리 및 재활용의 최적화를 위한 분쇄 특성에 관한 연구 (The Study of Milling Properties for Optimization of Treatment and Recycling of Converter Slag)

  • 구성은;황경진;김동수
    • 대한환경공학회지
    • /
    • 제22권6호
    • /
    • pp.1139-1148
    • /
    • 2000
  • 산업 폐기물 중 다량으로 발생하는 제강슬래그의 재활용을 위하여 -14/+24mesh 정도 크기의 슬래그를 미분말로 분쇄시 최적 조건을 조사하고 경제적인 분쇄조건을 확립하기 위하여 요구되는 동력을 산출하였다. 이를 위한 분쇄조건으로 ball mill의 회전속도, 분쇄시간, ball의 충진량, 시료의 충진량과 크기 등을 선정하였고 이에 대한 분쇄효율을 산출하였다. 본 연구에서는 임계회전속도의 79% 정도에 해당되는 값이 최적의 회전속도인 것으로 조사되었다. 분쇄시간에 따른 분쇄정도는 일반적으로 시간이 증가함에 따라 증가하는 것으로 나타났지만 분쇄 초기에 비해 분쇄가 더 진행될수록 분쇄효율은 감소하는 것으로 나타났다. Ball의 충진율은 mill내부 용량의 50%인 경우에 최척의 분쇄효율을 보였고, 시료의 충진량과 크기에 따른 입도초사 실험 에서는 시료의 충진량이 적고 원시료의 크기가 작을수록 분쇄정도는 증가하였다. 위의 결과에 의해 Bond의 식을 사용하여 동력효율을 계산한 결과 분쇄시간이 길수록 그리고 회전속도가 최적인 조건에서 동력효율이 가장 크게 나타나고 있음이 관찰되었다.

  • PDF

취학 전 정상구어발달 아동의 조음교대운동 특성 (The study of diadochokinetic (DDK) rate and accuracy in typically developing children)

  • 서경희
    • 한국산학기술학회논문지
    • /
    • 제14권1호
    • /
    • pp.321-327
    • /
    • 2013
  • 본 논문은 자연스럽고 빠르게 모델링했을 때 4~6세 37명이 산출한 조음교대운동(DDK) 결과를 통해 모음구조의 DDK도 임상적 가치가 있음을 확인했고, DDK속도와 함께 조음오류 빈도와 유형 및 규칙성도 분석해야 말장애 아동의 조음능력에 대한 더 정확한 정보를 얻을 수 있음을 제안하고 있다. 자모음(예: '퍼')과 모음(예: '아이')의 음운구조를 반복 산출한 자료에서 각 검사음을 반복한 횟수, 오류 빈도, 오류 유형 및 규칙성(DDKsdp)을 측정했다. 그 결과, 조음교대운동 평균 속도는 연령과 함께 증가했으나, 음운 구조나 연령에 따른 유의한 차이는 없었다. DDK 수행시 나타난 실수를 분석한 결과, 4세의 오류빈도는 5세 및 6세에 비해 유의하게 높았다. DDKsdp에서 표준화된 발음검사 점수와 연령에 따른 차이는 없었다.

기후변화에 따른 기후영향인자를 고려한 수문학적 안전성 평가 체계 구축에 관한 연구 (A Study on the Establishment of Hydrological Safety Evaluation System Considering the Climate Change Effects Factors)

  • 박지연;정일원;김미나;권지혜
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2018년도 학술발표회
    • /
    • pp.460-460
    • /
    • 2018
  • 댐 수문학적 안전성평가는 "시설물의 안전 및 유지관리에 관한 특별벌(이하 시특법)"에 따른 댐시설물의 정밀안전진단의 안전성평가 중 가장 중요한 평가 항목으로 댐 시설물을 평가 수행 시 주요한 평가 항목이다. 기존의 수문학적 안전성평가는 가능최대강수량 발생 시 댐의 월류 및 여유고 확보여부에 대한 평가 여부만 판단하고 있으나, 본 연구에서는 기후변화를 고려하는 장기적 관점의 추가 평가항목을 도출하고자 한다. 현재 가능최대강수량으로 event적 평가를 수행하는 수문학적 안전성 평가에서 기존평가항목 뿐만 아니라, 기후변화 장기적 관점의 추가적인 기후영향인자를 도출하고 이를 함께 적용할 수 있는 평가 체계를 구축하고자한다. 장기적 관점의 기후영향인자라 함은 기상청에서 제공하는 기후변화 시나리오 결과에서 30년동안 장기적인 관점에서 대상 댐의 운영에 부담을 야기할 것으로 판단되는 인자를 말하는 것이며, 이때 기후변화 시나리오의 일자료를 활용하여 기후인자의 장기적 변동성을 추정하고자 하며, 이때 활용한 지표로는 월최대강수량, 연강우강도 및 댐 상태에 영향을 미칠 수 있는 최소기온을 사용하였다. 기후변화 시나리오의 불확실성을 최소화하기 위하여 월최대 강수량값을 산출하였고, 1년 동안 발생한 강우의 일수 및 강수량에 대한 영향을 고려하기 위하여 연강우강도값을 산출하였다. 또한 댐의 월류 및 여유고 확보여부 평가 시 댐 상태에 대하여 고려하기 때문에 댐의 외부상태에 영향을 주는 최소기온을 활용하여 댐별 평가를 수행하였다. 이때 2011~2040년(S1), 2041년~2070년(S2), 2071년~2100년(S3)기간으로 나누어 장기간 기후에 대한 영향 평가를 수행하여 1종 댐 시설물의 기후영향인자 값을 도출하였다. 도출된 기후영향인자를 기존 수문학적 안전성평가 항목과 함께 평가 될 수 있도록 AHP분석기법을 활용하여 각 인자에 대한 가중치를 재산출하였고, 기후영향인자를 고려하는 수문학적 안전성평가 체계를 구축하였다.

  • PDF

기계 번역 의미 대역 패턴을 이용한 한국어 복합 명사 의미 결정 방법 (A Method of Word Sense Disambiguation for Korean Complex Noun Phrase Using Verb-Phrase Pattern and Predicative Noun)

  • 양성일;김영길;박상규;나동렬
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2003년도 제15회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.246-251
    • /
    • 2003
  • 한국어의 언어적 특성에 의해 빈번하게 등장하는 명사와 기능어의 나열은 기능어나 연결 구문의 잦은 생략현상에 의해 복합 명사의 출현을 발생시킨다. 따라서, 한국어 분석에서 복합 명사의 처리 방법은 매우 중요한 문제로 인식되었으며 활발한 연구가 진행되어 왔다. 복합 명사의 의미 결정은 복합 명사구 내 단위 명사간의 의미적인 수식 관계를 고려하여 머리어의 선택과 의미를 함께 결정할 필요가 있다. 본 논문에서는 정보 검색의 색인어 추출 방법에서 사용되는 복합 명사구 내의 서술성 명사 처리를 이용하여 복합 명사의 의미 결정을 인접 명사의 의미 공기 정보가 아닌 구문관계에 따른 의미 공기 정보를 사용하여 분석하는 방법을 제시한다. 복합 명사구 내에서 구문적인 관계는 명사구 내에 서술성 명사가 등장하는 경우 보-술 관계에 의한 격 결정 문제로 전환할 수 있다. 이러한 구문 구조는 명사 의미를 결정할 수 있는 추가적인 정보로 활용할 수 있으며, 이때 구문 구조 파악을 위해 구축된 의미 제약 조건을 활용하도록 한다. 구조 분석에서 사용되는 격틀 정보는 동사와 공기하는 명사의 구문 관계를 분석하기 위해 의미 정보를 제약조건으로 하여 구축된다. 이러한 의미 격틀 정보는 단문 내 명사들의 격 결정과 격을 채우는 명사 의미를 결정할 수 있는 정보로 활용된다. 본 논문에서는 현재 개발중인 한영 기계 번역 시스템 Tellus-KE의 단문 단위 대역어 선정을 위해 구축된 의미 대역패턴인 동사구 패턴을 사용한다. 동사구 패턴에 기술된 한국어의 단문 단위 의미 격 정보를 사용하는 경우, 격결정을 위해 사용되는 의미 제약 조건이 복합 명사의 중심어 선택과 의미 결정에 재활용 될 수 있으며, 병렬말뭉치에 의해 반자동으로 구축되는 의미 대역 패턴을 사용하여 데이터 구축의 어려움을 개선하고자 한다. 및 산출 과정에 즉각적으로 활용될 수 있을 것이다. 또한, 이러한 정보들은 현재 구축중인 세종 전자사전에도 직접 반영되고 있다.teness)은 언화행위가 성공적이라는 것이다.[J. Searle] (7) 수로 쓰인 것(상수)(象數)과 시로 쓰인 것(의리)(義理)이 하나인 것은 그 나타난 것과 나타나지 않은 것들 사이에 어떠한 들도 없음을 말한다. [(성중영)(成中英)] (8) 공통의 규범의 공통성 속에 규범적인 측면이 벌써 있다. 공통성에서 개인적이 아닌 공적인 규범으로의 전이는 규범, 가치, 규칙, 과정, 제도로의 전이라고 본다. [C. Morrison] (9) 우리의 언어사용에 신비적인 요소를 부인할 수가 없다. 넓은 의미의 발화의미(utterance meaning) 속에 신비적인 요소나 애정표시도 수용된다. 의미분석은 지금 한글을 연구하고, 그 결과에 의존하여서 우리의 실제의 생활에 사용하는 $\ulcorner$한국어사전$\lrcorner$ 등을 만드는 과정에서, 어떤 의미에서 실험되었다고 말할 수가 있는 언어과학의 연구의 결과에 의존하여서 수행되는 철학적인 작업이다. 여기에서는 하나의 철학적인 연구의 시작으로 받아들여지는 이 의미분석의 문제를 반성하여 본다.반인과 다르다는 것이 밝혀졌다. 이 결과가 옳다면 한국의 심성 어휘집은 어절 문맥에 따라서 어간이나 어근 또는 활용형 그 자체로 이루어져 있을 것이다.으며, 레드 클로버 + 혼파 초지가 건물수량과 사료가치를 높이는데 효과적이었다.\ell}$ 이었으며 , yeast extract 첨가(添加)하여 배양시(培養時)는 yeast extract 농도(濃度)가 증가(增加)함에 따라 단백질(蛋白質) 함량(含量)도 증가(增加)하였다. 7. CHS-13 균주(菌株)의 RNA 함량(

  • PDF

고해상도 지역기후변화 시나리오를 이용한 한국의 미래 기온극값 변화 전망 (Future Projection of Changes in Extreme Temperatures using High Resolution Regional Climate Change Scenario in the Republic of Korea)

  • 이경미;백희정;박수희;강현석;조천호
    • 대한지리학회지
    • /
    • 제47권2호
    • /
    • pp.208-225
    • /
    • 2012
  • 이 연구에서는 한국의 미래 기온극값의 변화를 전망하고자 하였다. 이를 위해 12.5km 고해상도의 지역기후모델(HadGEM3-RA)에서 생산된 일 최고 및 최저 기온 자료와 관측 자료를 이용하여 RCP4.5/8.5 시나리오에 따른 6개 극한기온 지수를 산출하고, 현재(1971-2000) 대비 21세기 말(2070-2099)의 공간 변화를 분석하였다. 현재 기간에 대해 모델에서 생산된 일 최고 및 최저 기온은 관측 자료의 확률분포 형태와 범위를 비교적 잘 모의한다. 현재 대비 21세기 말에 결빙일(ID)과 서리일(FD)은 전 지역에서 감소하고 여름일(SD)과 열대야(TR)는 증가할 것이며, 95퍼센타일을 초과하는 일 최고기온(TX95)과 5퍼센타일 미만 일 최저기온(TN5)의 평균값은 전 지역에서 상승할 것으로 전망된다. 이는 RCP4.5보다 RCP8.5 시나리오의 경우에 더 강하다. 고도는 ID, SD, TR, TX95, TN5와 위도는 ID, TR, TN5의 변화와 유의한 상관관계를 보인다. 21세기 말에 산지에서는 기온의 하위 극값 상승, 남해안에서는 열대야 증가로 인한 영향이 강하게 나타날 것으로 전망된다.

  • PDF