• 제목/요약/키워드: 단어길이

검색결과 147건 처리시간 0.02초

효과적인 이메일 분류를 위한 빈발 항목집합 기반 최적 이메일 폴더 추천 기법 (A proper folder recommendation technique using frequent itemsets for efficient e-mail classification)

  • 문종필;이원석;장중혁
    • 한국컴퓨터정보학회논문지
    • /
    • 제16권2호
    • /
    • pp.33-46
    • /
    • 2011
  • 이메일이 중요한 정보 전달과 의사소통의 수단으로 널리 활용된 이래 사람들은 이메일을 내용에 따라 적절하게 분류하는 작업에 많은 노력을 기울려 왔다. 이메일은 문서의 길이나 문체가 다양하며 사용되는 단어들이 비정규적이다. 또한 이메일 분류 기준은 일반적으로 해당 이메일 사용자의 주관에 따라 정의된다. 따라서 기존의 일반적인 문서분류 기법으로는 이메일을 효율적으로 분류하는데 어려움이 있다. 상업용 이메일 프로그램에서 제공되는 분류 기능은 메일 클라이언트에서 지원하는 텍스트 필터링을 이용한다. 한편 이메일의 자동 분류에 관한 연구는 확률 기반의 나이브 베이지안 기법을 응용하여 정확도를 높일 수 있는 연구가 주로 진행되어 왔으며, 대부분 영문 이메일에 대한 연구이다. 본 논문에서는 빈발 패턴 마이닝 기법을 적용하여 한글 이메일에 대한 개인 맞춤형 폴더 추천기법을 제시한다. 이메일의 맞춤형 폴더 추천 기법은 이메일에 대한 전처리 과정과 빈발 항목집합을 이용한 메일 폴더의 프로파일 생성과정으로 구성된다. 생성된 프로파일은 분류 대상이 되는 각 메일이 개인별 맞춤형 기준에 따라 가장 적합한 이메일 폴더로 효과적으로 분류되는데 활용된다. 또한 제안된 기법을 적용한 이메일 분류 시스템을 구현한다.

재료 동적영향을 고려한 주냉각재 배관 LBB 적용시 Dynamic Strain Aging의 영향 분석

  • 양준석;박치용;정우태;유기완;김진원
    • 한국원자력학회:학술대회논문집
    • /
    • 한국원자력학회 1998년도 춘계학술발표회논문집(2)
    • /
    • pp.305-311
    • /
    • 1998
  • 최근들어 고려된 LBB(Leak Before Break) 적용요건중 동적파괴시힘 절차에는 울진 3&4호기 이후 파단전누설개념이 적용되는 배관이 탄소강으로 제작될 경우. 이 배관이 Dynamic Strain Aging (DSA)에 의해 파괴저항치가 감소되지 않는다는 것이 정량적으로 입증되지 않는 한, 동 배관의 파괴 물성치 결정시 DSA의 영향이 고려되어야 하며, DSA 영향을 평가하기 위해서는 동적과괴시험이 수행되어야 함을 요건화 하고 있다. 본 연구에서는 DSA 효과에 의한 파괴저항(J-R) 특성의 저하가차세대원전 원자로냉각재배관 파단전누설개넘(LBB) 적용시 설계 안전여유도에 영향을 미치지 않는 정도임을 평가하는데 있다. 따라서 ASME Section III에서 탄소강으로 분류하고 있는 강종별 파괴인성 변화를 고찰하고, 차세대원전 주냉각재배관 재료인 SA508 Class la의 최대 파괴인성 감소치를 예측하여, 울진 3&4호기에서 측정된 엘보우용 SA516-Gr.70 강의 DSA 영향 평가 결과와 비교 분석하여 차세대원전 주냉각재배관의 DSA영향을 평가하였다. 도출된 결론으로는 DSA 영향을 고려한 SA508 Class la의 J 및 dJ/dA 값은 극히 보수적으로 추정할 때 50% 이상 감소하는 것으로 예측된다. 이러한 DSA 영향을 고려하였을 경우 배관재 모재의 파괴인성치는 Weld-SAW의 J/T 값 수준으로 감소하였다. 그러나 현 LRB 해석이 가장 낮은 J/T값을 갖는 Weld-SAW Auto의 균열길이 2a인 J/T선도에 의거하여 수행되고 있다는 점을 고려한다면 비록 DSA가 배관재에 영향을 주는 가장 보수적인 값(J 및 dJ/dA값을 50% 이상)을 사용한다고 하더라도 차세대원전 LBB 적용에 문제가 되지 않음을 알 수 있다. 즉 차세대원자로 주냉각재배관에 LBB를 적용하는데는 DSA 영향은 상대적으로 중요하지 않다는 결론을 얻었다. 표면에 수소화물이 농축되어 있는 hydride layer가 형성됨을 관찰하였으며 ~5,000ppm 이상의 경우에는 수소화물의 방향성이 random하였으며 특히, ZIRLO$^{TM}$ 시편의 경우에서는 원주방향으로 길게 이어진 수소화물과 기계적 성질에 치명적인 반경방향의 수소화물이 평행하게 배열된 것을 관찰하였다.하였을 때는 Li$_2$O의 첨가에 의해 치밀화가 주로 일어났고, 반면에 $N_2$-7vol.%H$_2$ 분위기에서 소결하면 Li$_2$O의 첨가에 의해 작은 기공은 소멸되고 큰 기공이 생성되었다.지나치게 모국어의 영향만 강조하고 다른 요인들에 대해서는 다분히 추상적인 언급으로 끝났지만 이 분석을 통 해서 배경어, 목표어, 특히 중간규칙의 역할이 괄목할 만한 것임을 가시적으로 관찰할 수 있 다. 이와 같은 오류분석 방법은 학습자의 모국어 및 관련 외국어의 음운규칙만 알면 어느 학습대상 외국어에라도 적용할 수 있는 보편성을 지니는 것으로 사료된다.없다. 그렇다면 겹의문사를 [-wh]의리를 지 닌 의문사의 병렬로 분석할 수 없다. 예를 들어 누구누구를 [주구-이-ν가] [누구누구-이- ν가]로부터 생성되었다고 볼 수 없다. 그러므로 [-wh] 겹의문사는 복수 의미를 지닐 수 없 다. 그러면 단수 의미는 어떻게 생성되는가\ulcorner 본 논문에서는 표면적 형태에도 불구하고 [-wh]의미의 겹의문사는 병렬적 관계의 합성어가 아니라 내부구조를 지니지 않은 단순한 단어(minimal $X^{0}$ elements)로 가정한다. 즉, [+wh] 의미의 겹의문사는 동일한 구성요 소를 지닌 병렬적 합성어([$[W1]_{XO-}$ $[W1]_{XO}$ ]$_{XO}$)로

  • PDF

광굴절 Cu-KNSBN 결정에서의 광신호 증폭 특성 (Optical signal amplification property in photorefractive Cu-KNSBN crystal)

  • 김성구;안준원;김남;이권연;서호형
    • 한국광학회:학술대회논문집
    • /
    • 한국광학회 2000년도 제11회 정기총회 및 00년 동계학술발표회 논문집
    • /
    • pp.288-289
    • /
    • 2000
  • SBN, BSKNN KNSBN 등의 tungsten-bronze 계열에 속하는 광굴절 결정은 짧은 파장에서 좋은 감광도와 빠른 응답시간을 갖는다. 이중에서도 KNSBN 결정은 큰 크기의 결정 성장 및 도핑이 용이하고 광굴절 결정에서 중요한 특성 중 하나인 열 안정성(thermal stability)이 좋기 때문에 빠른 응답특성이 요구되는 응용분야에서 촉망받는 매질이다. 본 논문에서는 광정보저장, 광정보처리, 광컴퓨터, 광통신과 같은 다양한 분야에서 응용가능성을 가지는 Cu가 0.04wt.%도핑된 5mm$\times$5mm$\times$5mm 크기의 KNSBN 결정을 이용한 광신호의 증폭기술에 대하여 연구하였다. 먼저 Cu-KNSNB 결정의 2광파 결합 특성을 분석하기 위하여, 기록 파장에 따른 지수이득계수의 외부입사각의존성, 최대 지수이득계수를 나타내는 외부입사각에서 입사빔의 세기비에 따른 2광파 결합 이득을 측정하였다. 또한, 632.8nm파장 영역에서 기록 및 삭제시간 상수, 회절 효율의 입사빔 세기비 의존성을 측정하였다. 그리고, 음향-광학 변조기(AOM: acousto-optic modulator)에 의해 진폭 변조된 신호빔을 이용하여 광신호 증폭특성을 분석하고 그 결과를 제시하였다. 이때 두 빔의 입사각은 최대 지수이득계수를 나타내는 입사반각 12$^{\circ}$로 고정하고, 감쇄기를 이용하여 신호빔의 세기를 조절하면서 신호빔의 차동이득을 측정하였다. 투과된 신호빔은 같은 주파수에서 차동 이득(diffrerential gain)을 보였으며, 이는 moving grating과 시간-변조된 신호빔(또는 펌프빔)사이의 새로운 상호작용은 광굴절 결정의 시간 적분 특성에 의한 것이다. (중략) 경우는 상온에서 펌프 펄스의 유지시간이 0.5% 인 경우 레이저가 동작하는 것을 보여주었다. 이는 구조내에서 열전도가 문제가 된다는 것을 의미하는데 위아래가 공기로 둘러 싸여 있어 발생한 열이 가는 유전체 네트웍을 통해서만 전달 될 수 있기 때문이다. (중략)$^4$A$_2$에 의한 nophonon line R$_1$, R$_2$(680.4, 678.5 nm) 및 $^2$T$_1$$\longrightarrow$$^4$A$_2$(655.7, 649.3, 645.2 nm)의 형광방출 스펙트럼을 얻었으며, 형광수명은 0.264 ms로 조사되었다. 제조된 레이저 발진봉은 직경 6.3 m, 길이 45 nm이었다.\pm$0.06kHz Ge $F_4$; -1.84$\pm$0.04kHz$0.04kHz/TEX>0.04kHz 모국어 및 관련 외국어의 음운규칙만 알면 어느 학습대상 외국어에라도 적용할 수 있는 보편성을 지니는 것으로 사료된다.없다. 그렇다면 겹의문사를 [-wh]의리를 지 닌 의문사의 병렬로 분석할 수 없다. 예를 들어 누구누구를 [주구-이-ν가] [누구누구-이- ν가]로부터 생성되었다고 볼 수 없다. 그러므로 [-wh] 겹의문사는 복수 의미를 지닐 수 없 다. 그러면 단수 의미는 어떻게 생성되는가\ulcorner 본 논문에서는 표면적 형태에도 불구하고 [-wh]의미의 겹의문사는 병렬적 관계의 합성어가 아니라 내부구조를 지니지 않은 단순한 단어(minimal $X^{0}$ elements)로 가정한다.

  • PDF

잡음축소된 광섬유 증폭기형 광원 방식의 자이로스코프 (Noise Subtraction in a Fiber-Optic Gyroscope with Fiber Amplifier/Source Configuration)

  • 진영준;박태용;박희갑
    • 한국광학회:학술대회논문집
    • /
    • 한국광학회 2000년도 제11회 정기총회 및 00년 동계학술발표회 논문집
    • /
    • pp.242-243
    • /
    • 2000
  • Erbium 첨가 광섬유(EDF) 광원은 출력 특성과 온도에 대한 파장 특성이 우수하여 Sagnac 간섭계의 원리를 이용한 광섬유 자이로스코프(이하 줄여 자이로라 함)에 많이 사용되고 있다. 이득매질인 EDF를 광원 겸 광증폭기로 사용하는 광섬유 증폭기형 광원 (Fiber Amplifier/source : FAS) 방식$^{[l-2]}$ 은 기존의 single-pass 방식$^{[3]}$ 에 비해서 구조가 단순하고 검출광 power가 크다는 장점이 있다. 그런데, 검출광 power가 큰 경우에 자이로의 SNR이 광원의 과잉잡음(excess noise)에 의해서 제한되므로 실제로 자이로의 측정감도는 개선되지 않는 문제점이 있다.$^{[4]}$ Single-pass 방식의 광원을 사용하는 경우, 적절한 신호처리를 통해 자이로 출력신호에 포함된 광원의 과잉잡음의 적정주파수 성분을 소거함으로써 자이로 신호의 SNR을 개선시킨 바 있었다.$^{[5]}$ 그러나, 일반적으로 single-pass 방식의 경우에는 검출광 power가 작아서 자이로의 SNR이 광원의 과잉잡음에 의해서 제한되는 경우는 드물다. 반면에 증폭기형 광원 방식은 자이로로부터 되돌아오는 신호광이 다시 광원으로 입사되어 EDF를 반대 방향으로 진행하는 동안 증폭되기 때문에 충분히 큰 검출광 power를 얻을 수 있다. 따라서, 자이로 신호에 포함된 광원의 과잉잡음이 소거된다면 자이로 신호의 SNR은 크게 개선될 것으로 여겨진다. 이 논문에서는 광섬유 증폭기형 광원 방식(FAS)의 자이로에 대해 위와 같은 신호처리를 이용하여 광인의 과잉잡음의 적정주파수 성분을 소거하는 실험을 하였다. (중략)한 흡수를 확인하고, $^4$T$_2$$\longrightarrow$$^4$A$_2$(650-800 nm), $^2$E$\longrightarrow$$^4$A$_2$에 의한 nophonon line R$_1$, R$_2$(680.4, 678.5 nm) 및 $^2$T$_1$$\longrightarrow$$^4$A$_2$(655.7, 649.3, 645.2 nm)의 형광방출 스펙트럼을 얻었으며, 형광수명은 0.264 ms로 조사되었다. 제조된 레이저 발진봉은 직경 6.3 m, 길이 45 nm이었다.\pm$0.06kHz Ge $F_4$; -1.84$\pm$0.04kHz$0.04kHz/TEX>0.04kHz 모국어 및 관련 외국어의 음운규칙만 알면 어느 학습대상 외국어에라도 적용할 수 있는 보편성을 지니는 것으로 사료된다.없다. 그렇다면 겹의문사를 [-wh]의리를 지 닌 의문사의 병렬로 분석할 수 없다. 예를 들어 누구누구를 [주구-이-ν가] [누구누구-이- ν가]로부터 생성되었다고 볼 수 없다. 그러므로 [-wh] 겹의문사는 복수 의미를 지닐 수 없 다. 그러면 단수 의미는 어떻게 생성되는가\ulcorner 본 논문에서는 표면적 형태에도 불구하고 [-wh]의미의 겹의문사는 병렬적 관계의 합성어가 아니라 내부구조를 지니지 않은 단순한 단어(minimal $X

  • PDF

언어 정보가 반영된 문장 점수를 활용하는 삭제 기반 문장 압축 (Deletion-Based Sentence Compression Using Sentence Scoring Reflecting Linguistic Information)

  • 이준범;김소언;박성배
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권3호
    • /
    • pp.125-132
    • /
    • 2022
  • 문장 압축은 원본 문장의 중요한 의미는 유지하면서 길이가 축소된 압축 문장을 생성하는 자연어처리 태스크이다. 문법적으로 적절한 문장 압축을 위해, 초기 연구들은 사람이 정의한 언어 규칙을 활용하였다. 또한 시퀀스-투-시퀀스 모델이 기계 번역과 같은 다양한 자연어처리 태스크에서 좋은 성능을 보이면서, 이를 문장 압축에 활용하고자 하는 연구들도 존재했다. 하지만 언어 규칙을 활용하는 연구의 경우 모든 언어 규칙을 정의하는 데에 큰 비용이 들고, 시퀀스-투-시퀀스 모델 기반 연구의 경우 학습을 위해 대량의 데이터셋이 필요하다는 문제점이 존재한다. 이를 해결할 수 있는 방법으로 사전 학습된 언어 모델인 BERT를 활용하는 문장 압축 모델인 Deleter가 제안되었다. Deleter는 BERT를 통해 계산된 perplexity를 활용하여 문장을 압축하기 때문에 문장 압축 규칙과 모델 학습을 위한 데이터셋이 필요하지 않다는 장점이 있다. 하지만 Deleter는 perplexity만을 고려하여 문장을 압축하기 때문에, 문장에 속한 단어들의 언어 정보를 반영하여 문장을 압축하지 못한다. 또한, perplexity 측정을 위한 BERT의 사전 학습에 사용된 데이터가 압축 문장과 거리가 있어, 이를 통해 측정된 perplexity가 잘못된 문장 압축을 유도할 수 있다는 문제점이 있다. 이를 해결하기 위해 본 논문은 언어 정보의 중요도를 수치화하여 perplexity 기반의 문장 점수 계산에 반영하는 방법을 제안한다. 또한 고유명사가 자주 포함되어 있으며, 불필요한 수식어가 생략되는 경우가 많은 뉴스 기사 말뭉치로 BERT를 fine-tuning하여 문장 압축에 적절한 perplexity를 측정할 수 있도록 하였다. 영어 및 한국어 데이터에 대한 성능 평가를 위해 본 논문에서 제안하는 LI-Deleter와 비교 모델의 문장 압축 성능을 비교 실험을 진행하였고, 높은 문장 압축 성능을 보임을 확인하였다.

토픽 모델링과 머신 러닝 방법을 이용한 온라인 C2C 중고거래 시장에서의 사기 탐지 연구 (A Study on the Fraud Detection in an Online Second-hand Market by Using Topic Modeling and Machine Learning)

  • 이동우;민진영
    • 경영정보학연구
    • /
    • 제23권4호
    • /
    • pp.45-67
    • /
    • 2021
  • 온라인 C2C 중고거래에 대한 수요가 증가하고 있으나 물품을 보내지 않거나 명시한 것과 다른 물건을 보내는 방식으로 부당한 금전적 이득을 챙기려는 사기 행위자들의 수도 증가하고 있다. 본 연구는 이러한 사기를 미연에 방지하기 위한 머신 러닝 방법을 이용한 사기 탐지 모델을 구축하였다. 이를 위해 대표적 C2C 중고거래 플랫폼인 중고나라에서 145,536건의 거래 게시글을 수집하였다. 이후 이들 게시글에서 토픽 모델링 기법을 이용하여 상품 설명 내용의 주제를 추출하였으며, 상품 설명의 언어적 특성, 준언어적 특성, 상품의 특성, 게시글의 포스팅 특성, 구매자 특성, 거래 특성들을 추출하였다. 이를 XGBoost 방법에 기반한 머신 러닝 모델을 구축하여 사기 게시글을 탐지하였다. 분석 결과, 사기 게시글은 글 자체의 길이가 대체로 짧고, 제공하는 정보가 적고 상대적으로 구체적이지 않은 것으로 나타났으며 명사를 상대적으로 적게 쓰고 이미지도 사용하지 않거나 적게 사용하는 글이 대부분인 것으로 나타났다. 또한 상대적으로 숫자와 공백의 비율이 높게 나타났으며 정상 게시글의 경우 명사의 경우 상품의 정보, 동사의 경우 전달, 형용사의 경우는 행위와 관련된 단어들이 사용되었으나 사기 게시글은 뚜렷한 주제를 가지지 못하는 것으로 나타났다. 본 연구는 전화번호나 계좌번호를 사용한 기존의 방법과 달리 다양한 게시글의 특성으로 사기 여부를 탐지하는 모델을 구축했다는 점에서 학술적, 실무적 시사점을 가지고 있다.

시조교육의 현황과 학습자 활동 중심의 교수$\cdot$학습 모형 - 고등학교 국어 교과서 수록 작품 <시조>를 중심으로 - (Plans for Teaching and Learning of Learner-centered Activities in Korean Verse Education)

  • 강명혜
    • 한국시조학회지:시조학논총
    • /
    • 제20집
    • /
    • pp.141-171
    • /
    • 2004
  • 시조는 우리의 시가사에 있어서 결코 소홀히 할 수 없는 시장르이다. 비록 고등학교 교과서에 수록된 시조는 단지 3편이었지만, 각각 평시조$\cdot$사설시조 현대시조를 대표한다는 점에서 세 작품을 통한 각각의 유형적인 이해를 할 수 있다. 효율적인 학습자 활동 중심의 학습을 위해서는 작품에 대한 충분한 지식이 선험적으로 체득될 수 있도록 수업전 단계로서 준비학습, 학습할 정보나 원리를 교사의 도움으로 익히도록 한다. 이를테면, 시조는 3장 구조의 정형으로 되어 있고 무색. 무취, 무미한 세계를 표방하고 있느니 만큼 비교적 주제를 밝히기가 수월하다는 점, 시조는 다른 장르에 비해 창작 배경을 구체적으로 형상화해 낼 수 있다는 점, 시조는 작품의 길이가 길지 않기 때문에 학습자의 고쳐쓰기 활동에 적합하다는 점, 시조는 대부분 사적 체험을 평범한 언어를 사용하여 직설적으로 표현하고 있기에 다른 장르나 일상적인 언어 형상과 연관짓기가 쉽다는 점에서 현대까지 이어지며 지속된다는 것 등이다 수업 단계에서는 이를 구체화$\cdot$단계화하는 과정을 거쳐서 쓰기 및 발표, 그리고 평가 및 정리를 거친 후, 수업 후 단계로는 반응일지 쓰기까지의 순차적인 단계를 제시하도록 한다. 구체화$\cdot$단계화하는 과정에서는, 평시조$\cdot$사설시조$\cdot$현대시조로 대표되는 (1)$\cdot$(2)$\cdot$(3)에서의 시적 화자의 감정은 대략 외롭고 쓸쓸하고 막막하고 답답하고 애틋함이라는 단어로 수렴되었지만 이렇듯이 비슷한 감정을 토로하거나 암시하는 작품들은 그러나 표면적으로 보았을 때는 서로 상당히 변별되는데, 이러한 차이는 유형의 구별에서 온다는 것, 유형적 변별성은 또한 사회 정치 문화적인 배경, 즉 컨텍스트적인 변별성에서 기인한다는 것도 파악하도록 한다. 이러한 수업 모형에서는 반드시 학습자는 컨텍스트$\cdot$텍스트에 관해 학습 전 준비를 철저히 해야하는데, 이 때 교사는 어디까지나 학습자의 주관적인 경험과 상상력을 위한 선이해 정도의 조력자의 역할만을 함으로써 상호 교류적인 의사 소통 구조를 형성하는데 밑받침이 되도록 한다.

  • PDF