• 제목/요약/키워드: multi-language

검색결과 675건 처리시간 0.027초

어텐션임베딩과 다채널 CNN 기반 반시민성 검출 알고리즘 (Detection of Incivility based on Attention-embedding and multi-channel CNN)

  • 박윤정;이세영;금희조
    • 한국정보통신학회논문지
    • /
    • 제26권12호
    • /
    • pp.1880-1889
    • /
    • 2022
  • 온라인 포털 플랫폼은 뉴스 기사와 온라인 댓글을 제공하고 있으나, 온라인 댓글의 익명성은 반시민적 표현을 증가시켜 사회적 문제점으로 간주되고 있다. 댓글의 반시민성 검출 연구가 많이 이루어진 국외와 달리, 국내에서는 비시민성을 세분화한 한국어 데이터셋이 구현되지 않아 심도있는 연구가 이루어지지 못하였다. 본 연구에서는 댓글의 반시민성에 대한 라벨링을 총 13가지 항목으로 시행하였으며 반시민적 표현으로 요약하였다. 또한 어텐션 알고리즘을 이중으로 적용하여 임베딩 벡터를 추출하였고 이후 2-d CNN으로 반시민성 항목을 분류하였다. 그 결과, 제안한 알고리즘이 무례한 호칭 및 공격적 어조 등의 반시민성 검출에 유용하다는 것을 보여주었다. 본 연구는 민주적 담론을 저해하는 반시민적 댓글들을 탐지함으로써 건전한 온라인 댓글 문화 형성에 기여할 것으로 기대된다.

반자동구축된 개체명 주석코퍼스 DecoNAC과 KoBERT를 이용한 개체명인식 플랫폼 DecoNERO (A Named Entity Recognition Platform Based on Semi-Automatically Built NE-annotated Corpora and KoBERT)

  • 김신우;황창회;윤정우;이성현;최수원;남지순
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.304-309
    • /
    • 2020
  • 본 연구에서는 한국어 전자사전 DECO(Dictionnaire Electronique du COreen)와 다단어(Multi-Word Expressions: MWE) 개체명을 부분 패턴으로 기술하는 부분문법그래프(Local-Grammar Graph: LGG) 프레임에 기반하여 반자동으로 개체명주석 코퍼스 DecoNAC을 구축한 후, 이를 개체명 분석에 활용하고 또한 기계학습에 필요한 도메인별 학습 데이터로 활용하는 DecoNERO 개체명인식 플랫폼을 소개하는 데에 목적을 두었다. 최근 들어 좋은 성과를 보이는 것으로 보고되고 있는 기계학습 방법론들은 다양한 도메인을 기반으로한 대규모의 학습데이터를 필요로 한다. 본 연구에서는 정교하게 설계된 개체명 사전과 다단어 개체명 시퀀스에 대한 언어자원을 바탕으로 하는 반자동으로 학습데이터를 생성하는 방법론을 제안하였다. 본 연구에서 제안된 개체명주석 코퍼스 DecoNAC 기반 접근법의 성능을 실험하기 위해 온라인 뉴스 기사 텍스트를 바탕으로 실험을 진행하였다. 이 실험에서 DecoNAC을 적용한 경우, KoBERT 모델만으로 개체명을 인식한 결과에 비해 약 7.49%의 성능향상을 기대할 수 있음을 확인하였다.

  • PDF

1798년 『서정민요집』의 저자의 기능과 시적 실험 (The Function of the Author and the Poetic Experiments in Lyrical Ballads of 1798)

  • 주혁규
    • 영어영문학
    • /
    • 제56권5호
    • /
    • pp.973-998
    • /
    • 2010
  • This paper aims at assessing the significance of Lyrical Ballads of 1798, the agreed inaugurator of English Romanticism, in terms of such key concepts as poetic "experiments," "conversation," and the authorial function. The 1798 volume marks an interesting incidence in which an author with no tangible substantiality can wield his authorial function over his works. The volume is signed without the named proper noun-its author is neither William Wordsworth nor Samuel Taylor Coleridge. The figure of the author in this case is realized by the poems he writes; he produces, and is produced by, his works-a fact that constitutes part of the poetic experiments manifested in the Advertisement. Working under this reciprocal production, the Author of the 1798 volume and his poems are collectively aiming at establishing a new class of poetry and an interpretive community. The notion of "conversation" is a key element in the thematic, stylistic ties among individual poems. Poems of the 1798 volume effect multi-layered, "blended" voices. Readers are expected to draw out the topological interweaving among poems through the practices of dialogic reading. In this light, the sequential necessity of "The Rime" and "Tintern Abbey" should be emphasized. They are stitched together in a logic of textual placement and the transition from one to the other is never arbitrary. Most of all, they are working under the same authorial function, complementing each other, and addressing the same poetic project in different textual locations. As an inaugural work of English Romanticism, Lyrical Ballads of 1798 in fact makes so many things happen and yet again anticipates something yet to come with elusiveness. The value of this poetic experiments should be judged not only by what is claimed in it, but what it sets out to do and "how far" it will be performed, as implied in the Advertisement. The efficacy of the volume, more than anything else, is dependent upon the performative power of words.

개인, 인종, 그리고 역사의 불협화음 -필립 로스의 『미국에 대한 음모』를 중심으로 (A Discord among Individual, Race, and History: Focused on Philip Roth's The Plot Against America)

  • 장정훈
    • 영어영문학
    • /
    • 제58권5호
    • /
    • pp.809-837
    • /
    • 2012
  • Philip Roth rejects the narrative unity and singularity of the traditional novel and creates instead a multi-levelled, fragmentary, and repetitive narrative. It is not easy to distinguish fact from fiction in The Plot Against America. As an entertaining and creative work of the postmodern historiographic metafiction, Philip Roth's The Plot Against America interrogates the existence of historically verifiable facts, the validity of authentic and official version of history, and reexamines the narrative conventions of history writing. The aim of this paper is to examine Roth's narrative experiment or 'thought experiment' and to explore the intention of creating alternative history in The Plot Against America. Roth does a 'thought experiment' in The Plot Against America. In this cautionary "what if" political fable, Roth hypothesizes that in 1940 aviation hero Charles Lindbergh, an ardent isolationist who was sympathetic to Hiltler, won the presidency. Jewish communities are stunned and terrified as America flirts with fascism and anti-semitism. Reimagining his children-with considerable fact mixed in with the fiction-Roth narrates an alternative history that has an unsettling plausibility. Roth has constructed a brilliantly telling and disturbing historical prism by which to refract the American psyche as it pertain to the discord of individual, race, history in The Plot Against America. Roth analyzes the life of individual in a historic space, the situation of anti-semitism in world of invisible order, racial conflict between black and white in world of visible order, and the darkest side of national power in this work. Roth's stories argue for the equality of various cultures grounded on the common notion of humanity, for an ethic of mutual respect, and for the peaceful resolution of conflicts.

Intrusion Detection System based on Packet Payload Analysis using Transformer

  • Woo-Seung Park;Gun-Nam Kim;Soo-Jin Lee
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권11호
    • /
    • pp.81-87
    • /
    • 2023
  • 네트워크 패킷의 메타데이터를 학습한 침입탐지시스템이 최근 많이 제안되었다. 그러나 이러한 방식은 모델 학습에 사용할 메타데이터 생성을 위해 패킷을 분석하는 시간, 그리고 학습 전 메타데이터를 전처리하는 시간이 필요하다. 또한, 특정 메타데이터를 학습한 모델은 실제 네트워크로 유입되는 원본 패킷을 그대로 사용하여 침입을 탐지하는 것이 불가능하다. 이러한 문제를 해결하기 위해 본 논문에서는 패킷 페이로드를 하나의 문장으로 학습시켜 침입을 탐지하는 자연어 처리 기반의 침입탐지시스템을 제안하였다. 제안하는 기법의 성능 검증을 위해 UNSW-NB15와 Transformer 모델을 활용하였다. 먼저, 데이터세트의 PCAP 파일에 대한 라벨링을 실시한 후 2종의 Transformer 모델(BERT, DistilBERT)에 문장 형태로 직접 학습시켜 탐지성능을 분석하였다. 실험 결과 이진분류 정확도는 각각 99.03%, 99.05%로 기존 연구에서 제안한 기법들과 유사하거나 우수한 탐지성능을 보였으며, 다중분류는 각각 86.63%, 86.36%로 더 우수한 성능을 나타냄을 확인하였다.

문화 인텔리전스는 수출중소기업의 해외시장정보 활용능력을 키우는가? (Does Cultural Intelligence enhance Export SME's Capability for Utilizing Foreign Market Informations?)

  • 홍성헌
    • 통상정보연구
    • /
    • 제19권1호
    • /
    • pp.127-152
    • /
    • 2017
  • 본 연구의 목적은 비교문화 연구에 비교적 새로운 개념으로서 Earley and Ang(2003)이 도입한 문화 인텔리전스(cultural intelligence : CQ)를 적용하여 중소기업 수출담당자의 문화 인텔리전스가 해외시장정보 탐색과 해외시장정보 활용능력(마케팅적응, 관계적응) 간의 관계에 어떤 영향을 미치는지를 분석하는 것이다. 구조모형 분석방법으로서 SmartPLS가 사용되었고, 94개 수출중소기업을 대상으로 실증적으로 분석한 결과, 문화 인텔리전스는 해외시장정보탐색과 해외시장정보 활용능력에 부분적으로 조절적 역할을 하는 것으로 검증되었다. 문화 인텔리전스의 선행요인으로서는 수출담당자의 외국어유창성, 해외출장빈도, 다국어구사력, 해외출장용무, 문화선행학습, 해외체류경험 등이 유의한 요인으로 검증되었다. 연구결과에 의거하면, 해외시장정보를 습득-이해-가공하는 과정에 문화 인텔리전스의 역할이 큰 것으로 추론할 수 있다. 따라서 다차원적 성격의 문화 인텔리전스 강화를 위해 기업 및 수출지원기관의 차별화된 문화역량 교육 및 훈련프로그램 개발이 필요하다.

  • PDF

주식 가격 변동 예측을 위한 다단계 뉴스 분류시스템 (Multi-stage News Classification System for Predicting Stock Price Changes)

  • 백우진;경명현;민경수;오혜란;임차미;신문선
    • 정보관리학회지
    • /
    • 제24권2호
    • /
    • pp.123-141
    • /
    • 2007
  • 주시가격을 예측하는 것은 주식 가격 변동에 영향을 미치는 많은 요인과 요인 간의 상호작용에 기인하여 매우 어렵다고 알려져 있다. 이 연구는 어떤 회사에 대한 좋은 기사는 그 회사의 주식가격을 오르도록 영향을 미칠 것이고 나쁜 기사는 그 반대의 작용을 할 것이라는 가정에서 시작했다. 여러 회사들에 대한 기사와 그 회사의 주식가격이 기사가 공개된 후에 어떻게 변했는가에 대한 분석을 통하여 위 가정이 맞는 것을 확인했다. 즉 기사의 내용을 기사에 나온 회사에 대하여 호의적인지 아닌지 신뢰성 있게 분류하는 방법이 있다면 어느 정도의 주식 가격 예측은 가능할 것이다. 많은 기사를 일관적으로 빨리 처리하기 위하여 상장회사에 대한 기사를 자동 분석하는 다단계 뉴스 분류시스템을 개발한 후 성능을 확인하여 자동 시스템이 무작위로 주가 변동을 예측했을 경우보다 높은 정확률을 보이는 것을 확인했다.

JAVA를 이용한 위성영상처리/분석 시스템 개발 : GeoPixel Ver. 1.0 (Development of a Remotely Sensed Image Processing/Analysis System : GeoPixel Ver. 1.0)

  • 안충현;신대혁
    • 대한원격탐사학회지
    • /
    • 제13권1호
    • /
    • pp.13-30
    • /
    • 1997
  • 초 미세 분광 분해능 센서, 고 공간 분해능 센서로 대표되는 최근의 위성 센서의 실용화 로, 향후 획득되는 위성 영상은 최소 수백 MB/scene 정도의 막대한 양이 될 것으로 예상된다. 또 한, 인터넷 및 초고속 정보망을 이용한 각종 정보의 활발한 교환은 보다 능동적인 형태의 위성영 상의 가공, 분석, 부가가치 정보 생산이 가능한 서비스 시스템의 개발을 요구한다. 본 연구에서는 향후 예상되는 위성 센서의 개발 방향과 이를 처리하기 위하여 고려되어야 할 미래지향적인 개념 인, 객체 파이프를 통한 자료의 입출력, 다중 쓰레드를 활용한 자료 처리 구조에 대하여 분석하 고, 인터넷 언어인 자바를 이용하여 개발 중에 있는, 위성 영상 처리 및 분석 시스템(GeoPixel 1.0)에 대하여 설명한다. 이 시스템은 인터넷 상에서 사용이 가능하며, 사용자 플랫폼에 독립적으 로, 상당 부분이 위성자료 분석 모듈들이 구현되어 있다. 대용량 위성 영상 처리를 위하여 본 연 구에서 개발된 다중쓰레딩, 객체 파이프와 같은 새로운 자료 처리 개념을 이용한 시스템의 개발 로 보다 효율적인 컴퓨터 자원(CPU 시간과 메모리)의 활용과 처리 속도면에서의 향상이 기대된 다.

텔레메트리 시스템을 위한 가변 컷 오프 주파수 및 가변 샘플 레이트 저면적 다채널 디지털 필터 설계 (Variable Cut-off Frequency and Variable Sample Rate Small-Area Multi-Channel Digital Filter for Telemetry System)

  • 김호근;김종국;김복기;이남식
    • 한국항행학회논문지
    • /
    • 제25권5호
    • /
    • pp.363-369
    • /
    • 2021
  • 본 논문에서는 텔레메트리 시스템을 위한 가변 컷 오프 주파수 및 가변 샘플레이트 특성을 지니는 저면적 다채널 디지털 필터구조를 제안한다. 제안하는 디지털 필터는 임의의 컷 비율에 대해 필터 뱅크의 추가적인 설계 없이 컷 오프 주파수와 샘플레이트를 가변적으로 사용할 수 있는 필터 뱅크를 구현함으로써 하드웨어 면적을 줄일 수 있었다. 또한, 멀티플렉서 (MUX; Multiplexer) 컨트롤을 통해 통과하는 필터의 개수에 따라 샘플레이트를 가변적으로 선택할 수 있는 구조를 제안한다. 제안하는 디지털 필터는 Quartus의 FIR (finite impulse response) IP (intellectual property)의 TDM (time division multiplexing)을 이용함으로써, TDM을 사용하지 않았을 때보다 면적이 큰 DSP (digital signal processing) 블록을 80개에서 1개로 줄일 수 있었다. Kaiser 창 함수를 이용하여 Matlab을 통해 필터의 차수와 계수를 계산하였으며, VHDL (very high speed integrated circuits hardware description language)을 통해 하드웨어로 구현하였다. 텔레메트리 시스템에 적용 후, 실험 결과를 통해 제안하는 디지털 필터가 정상적으로 동작하고 있음을 확인하였다.

셀룰러 오토마타 기반 WCA2D 모형을 이용한 부산 온천천 유역 고해상도 도시 침수 해석 (High-resolution Urban Flood Modeling using Cellular Automata-based WCA2D in the Oncheon-cheon Catchment in Busan, South Korea)

  • 최현진;이송희;우현아;노성진
    • 대한토목학회논문집
    • /
    • 제43권5호
    • /
    • pp.587-599
    • /
    • 2023
  • 기후변화로 인해 전 세계 주요 도시에서 홍수의 빈도와 위험성이 증가함에 따라, 도시 침수에 대비한 선제적 대응을 위해 넓은 공간 영역에서 고해상도 2차원 침수 정보를 신속하고 정확하게 해석할 수 있는 모의 기술의 중요성이 대두되고 있다. 기존의 천수 방정식(shallow water equations)에 기반한 물리적 해석 방법은 고해상도 침수 예측을 위해 많은 컴퓨터 자원과 계산 시간이 소요되는 한계가 있다. 본 연구는 전환 규칙과 가중치 기반 시스템을 사용하여 침수의 시공간 변화를 모의하는 셀룰러 오토마타(cellular automata) 기반 2차원 침수 해석 모형 Weighted Cellular Automata 2D (WCA2D)의 이론적 배경을 고찰하고, 부산 온천천 유역의 침수 사상 모의를 통해 재현하여 국내 도시 유역에 대한 적용성을 검토하였다. 또한, Open Computing Language (OpenCL)와 Open Multi-Processing (OpenMP)과 같은 병렬계산(parallel computing)기술을 적용한 버전을 순차계산(sequential computing)결과와 비교하여 연산성능을 평가 하였다. 연구결과, WCA2D 모형에 의한 최대 침수심 분포는 과거침수 피해지도와 유사하게 모의되어, 복잡한 지형특성을 가지는 도시유역 침수의 시공간적 변화를 해석하기에 적절함을 확인하였다. 또한,병렬 계산 적용시 순차 계산 버전에 비해 OpenCL과 OpenMP는 약8배~14배, 5배~6배 연산 효율이 향상되어 효율적인 도시 침수 모의가 가능하였다.