• Title/Summary/Keyword: 수도데이터

Search Result 517, Processing Time 0.026 seconds

AI-based language generation model analysis (인공지능 기반의 언어 생성 모델 분석)

  • Lee, Seung Cheol;Jang, Yonghun;Park, Chang-Hyeon;Seo, Yeong-Seok
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2020.05a
    • /
    • pp.519-522
    • /
    • 2020
  • 1989년에 WWW(World Wide Web)이 도입 되면서 세계적으로 인터넷의 보급이 시작되었다. 정보화 시대라고 알려진 3차 산업혁명 이후로 대량의 정보들이 소셜 미디어를 통하여 생산되었다. 소셜미디어는 2007년에 인터넷 사용자들 중 56%의 이용률을 보였지만 2008년 2분기에는 75%의 이용률로 증가함에 따라 대부분의 사용자들이 많이 사용하며 의존하게 되었다. 또한 소셜 미디어를 통해 발생 되는 데이터들을 이용하여 기업들은 이윤 창출을 할 수 있다. 하지만 이러한 소셜 미디어는 악의적인 목적을 통해 주가 조작, 정치적 선동 등을 할 수 있는 가짜 뉴스와 허위 정보들을 생성할 수 있으며 이에 따라 대책이 시급하다. 또한 가짜 뉴스는 사람이 글을 작성할 수도 있지만 최근 인공지능 기술의 발달에 따라 프로그램을 통해 자동적으로 생성 될 수도 있다. 본 논문에서는 이와 같은 실제 뉴스와 인공지능을 기반으로 한 뉴스를 분석한다. Kaggle에서 실제 뉴스 데이터를 수집하여 헤드라인을 OpenAI의 GPT-2 언어 모델을 통해 뉴럴 가짜 뉴스를 생성 하였다. 파이썬의 NLTK 모듈을 이용하여 전처리를 진행하였고 t-검정과 박스 플롯을 활용하여 분석을 진행하였다. 분석된 주요 속성들을 의사결정트리를 통해 모델 검증을 하였고 k-fold 교차검증을 통해 분류 모델을 평가하였다. 결과로 전체 분류 정확도 평균 89%의 성능을 보여주었다.

A Novel Geographical Routing Protocol for Multi-Rate Mobile Ad Hoc Networks (다중전송률 지원 이동 Ad Hoc 네트워크를 위한 위치 정보 기반 라우팅 프로토콜)

  • Hwang Jee-Na;Ko Young-Bae
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.06d
    • /
    • pp.109-111
    • /
    • 2006
  • 이동 Ad Hoc 네트워크(MANET)에서 많은 영역에 걸쳐 다양한 라우팅 프로토콜들이 제안되어 왔다. 다중전송률은 현재 많은 무선 랜 카드에 의해 지원되고 있고, 그 효과에 관한 라우팅 프로토콜 알고리즘들이 연구되고 있다. 다중전송률에서의 high-rate을 이용한 데이터 전송은 일정한 시간 내에 더 많은 데이터를 전송할 수 있기 때문에 높은 throughput을 기대 할 수 있다. 그러나 high-rate을 이용한 데이터 전송의 경우 전송이 가능한 거리가 짧아져 목적노드까지 도달하는 데에 더 많은 홉을 거쳐야 한다. 그로 인해 패킷을 전달하는데 걸리는 시간이 늘어나 전교 네트워크의 성능을 저하시킬 수도 있다. 본 논문에서는 노드들의 이동으로 인한 네트워크의 토폴로지 변화나 채널의 상태에 따라 어떤 전송 속도로 데이터를 전송할 것인가를 결정하기 위해 다중전송률을 고려한 위치 정보 기반의 라우팅 프로토콜을 제안한다.

  • PDF

A Congestion Control Technique for the Bottleneck Nodes in Wireless Sensor Networks (싱크 주변 노드를 위한 센서 네트워크 혼잡 제어 기술)

  • Moon Sung-Hyun;Lee Sung-Min;Cha Ho-Jung
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.06d
    • /
    • pp.154-156
    • /
    • 2006
  • 본 논문은 기존의 혼잡 제어 기술이 전체 노드들을 위해 설계 되어 싱크 주변에서 생성되는 특별한 혼잡을 해결 할 수가 없기 때문에 싱크 주변 노드를 위한 혼잡 제어 기술을 제안한다. 싱크 주변에서 일어나는 'Bottle Neck' 문제가 일어났을 경우 데이터의 분석에 의한 우선순위결정과 타임 스케줄을 이용한 순차적인 데이터 전송으로 혼잡을 줄이고 그로 인해 데이터의 의미 있는 전송과 신뢰성을 동시에 만족시킨다. 또한 이 기술은 멀티 싱크 또는 모바일 싱크에도 적용 시킬 수 있고, 기존의 전체 노드를 위한 혼잡 제어 기술과 제시하는 기술을 혼용하여 사용할 수도 있다. 본 논문이 제안하는 기법은 혼잡 제어를 하지 않은 상태에서의 데이터 전달 방식에 비해 데드라인 만료 비율이 1.5%이상 감소하였고 프레임 손실율 또한 28%이상 감소하였다.

  • PDF

다중홉 다중 링크 ad-hoc 망에서 예약 메카니즘을 이용한 파워 제어 프로토콜의 성능 분석

  • 윤현민;최덕규;조영종
    • Proceedings of the Korea Society for Simulation Conference
    • /
    • 2000.11a
    • /
    • pp.91-96
    • /
    • 2000
  • 차세대 무선 통신 서비스의 응용은 다양한 형태로 발전하고 있다. 그 중에서 응급상황이나 학내망 같이 특수한 경우에 제공될 수 있는 시나리오로 다중 홉(Multi-hop) 다중 링크(Multi-link) ad-hoc 망을 들 수 있다. Ad-hoc망은 한정된 자원 문제와 변화가 심한 링크 용량문제가 있으며, 다중 홉상의 노드가 이동함으로 토폴로지의 동적 변화문제도 발생한다. 이러한 망의 노드는 송·수신단 역할을 할 뿐만 아니라 패킷을 전달하는 중간 노드의 역할도 하기 때문에 파워의 절약 매카니즘이 절실히 필요하게 된다. 본 논문은 PAMAS에 기반하여, 별도의 제어 채널에 버퍼를 두어 송·수신자 주소와 전송할 데이터의 크기의 정보를 버퍼에 기록하여 예약하고 제어 채널에서 데이터 채널의 파워를 제어할 수도 있으므로 데이터 전송에서 충돌을 예방하고 효율적으로 파워를 절약할 수 있다. 데이터 전송 발생율을 바꿔가며 시뮬레이션 결과 일반적인 방법을 사용한 노드들보다 훨씬 좋은 파워 절약을 이루고 있음을 알 수 있었다.

  • PDF

A Korean POS Tagging System with Handling Corpus Errors (말뭉치 오류를 고려한 HMM 한국어 품사 태깅 시스템)

  • Seol, Yong-Soo;Kim, Dong-Joo;Kim, Kyu-Sang;Kim, Han-Woo
    • KSCI Review
    • /
    • v.15 no.1
    • /
    • pp.117-124
    • /
    • 2007
  • 통계 기반 접근 방법을 이용한 품사태깅에서 태깅 정확도는 훈련 데이터의 양에 좌우될 뿐 아니라, 말뭉치가 충분할지라도 수작업으로 구축한 말뭉치의 경우 항상 오류의 가능성을 내포하고 있으며 언어의 특성상 통계적으로 신뢰할만한 데이터의 수집에도 어려움이 따른다. 훈련 데이터로 사용되는 말뭉치는 많은 사람들이 수작업으로 구축하므로 작업자 중 일부가 언어에 대한 지식이 부족하다거나 주관적인 판단에 의한 태깅 실수를 포함할 수도 있기 때문에 단순한 저빈도와 관련된 잡음 외의 오류들이 포함될 수 있는데 이러한 오류들은 재추정이나 평탄화 기법으로 해결될 수 있는 문제가 아니다. 본 논문에서는 HMM(Hidden Markov Model)을 이용한 한국어 품사 태깅에서 재추정 후 여전히 존재하는 말뭉치의 잡음에 인한 태깅 오류 해결을 위해 비터비 알고리즘적용 단계에서 데이터 부족과 말뭉치의 오류로 인해 문제가 되는 부분을 찾아내고 규칙을 통해 수정을 하여 태깅 결과를 개선하는 방안을 제안한다. 실험결과는 오류가 존재하는 말뭉치를 사용하여 구현된 HMM과 비터비 알고리즘을 적용한 태깅 정확도에 비해 오류를 수정하는 과정을 거친 후 정확도가 향상됨을 보여준다.

  • PDF

Mining Maximal Frequent Contiguous Sequences in Biological Data Sequences (생물학적 데이터 서열들에서 빈번한 최대길이 연속 서열 마이닝)

  • Kang, Tae-Ho;Yoo, Jae-Soo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2006.11a
    • /
    • pp.645-648
    • /
    • 2006
  • 생물학적 데이터 서열에는 크게 DNA 서열과 단백질 서열이 있다. 이들 서열 데이터들은 여러 데이터베이스에 걸쳐 매우 방대한 양을 가지고 있으며, 각각의 서열은 수백 또는 수천 개의 항목들을 가지고 있어 길이가 매우 길다. 일반적으로 유전적인 변형, 또는 변이로부터 보존된 영역이나 특정 패턴들을 서열 안에 포함하고 있는데 생물학적 서열 데이터에서 보존된 영역이나 패턴들은 계통발생학적 근거로 활용 될 수도 있으며 기능과 밀접한 관계를 가지기도 한다. 따라서 서열들로부터 빈번하게 발생하는 패턴을 발견하고자 하는 알고리즘 개발이 요구되고 있다. 초창기 Apriori 알고리즘을 변형하여 빈발 패턴을 발견하고자 하는 노력들로부터 근래에는 PrefixSpan 트리를 이용하여 효과적으로 성능을 개선하고 있지만 아직까지는 여러 번의 데이터베이스 접근이 요구되고 있어 성능저하가 발생한다. 이에 본 논문에서는 접미사 트리를 변형하여 데이터베이스 접근을 획기적으로 줄이고 많은 서열들로부터 빈번하게 발생하는 연속적인 서열을 효과적으로 발견하는 방법을 제안한다.

  • PDF

Historical Data, Transaction and Database for Industrial Monitoring and Control Applications (산업감시 및 제어 응용을 위한 이력 데이터, 트랜잭션 그리고 데이터베이스)

  • Han, Sang-Hyuck;Kim, Young-Kuk
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2012.04a
    • /
    • pp.1051-1053
    • /
    • 2012
  • SCADA, DCS, PLC 등 산업제어시스템은 전기, 수도, 수송, 가스 및 석유와 같은 국가기반시설의 감시 및 제어를 통해 위험의 조기 예측, 대응, 각 공정의 품질 향상 등에 기여하고 있다. 산업제어시스템은 HMI(Human Machine Interface), 이력 데이터베이스, 각 센서 H/W 및 S/W 기술로 구성되는데, 그 중 이력 데이터베이스는 실시간으로 들어오는 디지털 및 아날로그 형태의 이력 데이터에 대한 효과적으로 처리하기 위한 주요 요소이다. 현재, 국내에서는 히스토리안 등 주로 외산 제품에 의존하고 있어 이에 대한 기반 기술 연구 및 관련 산업화가 요구된다. 또한, 이력 데이터베이스의 종류 및 특성에 대한 연구가 선행되어야 한다. 본 논문에서는 산업제어시스템에 주로 적용된 이력 데이터베이스들에 대해 자세히 살펴보고, 일반적으로 사용되는 데이터와 산업제어시스템에서 사용하는 이력 데이터와 트랜잭션의 특징을 살펴봄으로써 산업제어 응용에서 요구되는 이력 데이터베이스가 어떤 모습을 갖추어야 할 지에 대한 이해를 높이고자 한다.

Comparison and Analysis of Lengths of Longest Common Subsequence and Maximal Common Subsequence (최장 공통 부분 서열과 극대 공통 부분 서열의 길이 비교 및 분석)

  • Lee, DongYeop;Na, Joong Chae
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2021.11a
    • /
    • pp.15-18
    • /
    • 2021
  • 최장 공통 부분 서열(Longest Common Subsequence, LCS)은 서열 유사도(Similarity)를 측정하기 위한 주요 지표 중 하나로 특별한 가정이 없는 한 두 문자열의 LCS 를 계산하기 위해서는 두 문자열의 길이의 곱에 비례하는 시간이 필요하다. 최근 최장(longest)이라는 조건을 극대(maximal)로 완화한 극대 공통 부분 서열(Maximal Common Subsequence, MCS)이 제시되었고, 두 문자열의 MCS 를 선형에 가까운 시간에 찾는 알고리즘이 개발되었다. 극대는 최장을 보장하지 않기 때문에 두 문자열의 MCS 길이는 LCS 길이와 달리 유일하지 않을 수 있고, LCS 길이가 매우 길어도 길이가 1인 MCS가 존재할 수도 있다. 본 논문에서는 기존 알고리즘에 의해 계산되는 MCS 의 효용성을 알아보기 위해, DNA 등 여러 종류의 실제 데이터와 랜덤 생성된 데이터에 대해 LCS 와 MCS 의 길이를 비교했다. MCS 길이는 LCS 길이 대비 실제 데이터에서 32.1 ~ 60.2%, 랜덤 데이터에서는 27.5 ~ 62.9%로 나타났다. 이 비율은 문자열을 이루고 있는 알파벳 수가 많을수록, 문자열의 길이가 길어질수록 감소했다.

Development of a water meter freeze test device for predicting the freezing time based on AI (AI 기반 동파시기 예측을 위한 수도계량기 동파시험장치 개발)

  • Kim, Kuk-il;An, Sang-byung;Kim, Jin-hoon;Hong, Sung-taek
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2021.05a
    • /
    • pp.233-234
    • /
    • 2021
  • The freezing of the water meter due to the cold wave in winter causes safety accidents caused by freezing and suspending the supply of tap water and various inconveniences. In this study, the water meter develops a test device similar to the environment in which the actual freezing occurs and tests repeatedly by changing the temperature, humidity, flow rate, pressure, valve improvement, pump operation status, etc. Based on the data obtained through this, it is planning to predict the timing of freezing by applying AI technology to correlation between freeze influencing factors.

  • PDF

Two Dimensional Inter-symbol Interference Compensation for Holographic Data Storage (홀로그래픽 데이터 저장 장치를 위한 2차원 인접 심볼간 간섭 보상)

  • Jeong, Seongkwon;Lee, Jaejin
    • Journal of the Institute of Electronics and Information Engineers
    • /
    • v.52 no.6
    • /
    • pp.10-14
    • /
    • 2015
  • In holographic data storage systems, data is recorded and read by page on a volume of storage medium, and it can increase transmission rate and storage capacity because of two-dimensional page-oriented data processing by charge-coupled devices. However, HDS suffers two-dimensional intersymbol interference unlike conventional data storages. In this paper, we propose a preprocessing method of decreasing ISI before read data in HDS pass to detector. This method has some advantage when we collaborate with the preprocessing for reducing misalignment error and modulation code.