• 제목/요약/키워드: 데이터 처리율

검색결과 1,045건 처리시간 0.036초

비정형 뉴스 데이터 분석을 통한 여론조사 지지율 도출 방안 연구 (A Study on Derivation of Approval Rating using Analysis of Unstructured News Data)

  • 송종훈;최기현;구자환;김응모
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2018년도 추계학술발표대회
    • /
    • pp.412-415
    • /
    • 2018
  • 헌재, 대부분의 여론조사는 전통적 여론 조사 방식을 사용하고 있다. 그러나 이 방식은 온라인 상에서의 여론을 반영하지 못한다는 문제점이 존재한다. 따라서 이를 해결하고 온라인 상에서의 여론을 반영하기 위해, 비정형 뉴스 데이터를 이용한 지지율 분석 방안을 제안하고자 한다. 이 연구에서는 제안 방안을 알아보고 기존의 방식과 비교한 장단점, 시사점, 개선방안 등을 알아봄으로써 새로운 여론조사 방식의 제안을 목적으로 한다.

파장분할 EPON에서 대역폭 할당 및 파장배정 방법 (Bandwidth Allocation and Wavelength Assignment Method in Wavelength Division Ethernet-PON)

  • 최용도;장용석;조정현;류상률;김승호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 춘계학술발표대회
    • /
    • pp.1241-1244
    • /
    • 2009
  • 인터넷을 기반의 멀티미디어 정보화 사회에서, 대용량 멀티미디어 데이터 서비스에 대한 요구가 확산되고 있다. 그러나 현재의 가입자 접속망으로는 데이터 전송 속도 및 거리 제약으로 인해 만족스러운 서비스를 사용자들에게 제공해 줄 수 없다. 가입자 접속망에서 현저하게 떨어지는 속도문제를 해결하고, QoS(Quality of Service)를 보장해 줄 수 있는 방안의 하나로 우선순위 큐를 고려한 가중치 기반의 차등 대역폭 할당 방식과 대역폭을 분할하여 파장에 배정하는 파장 분할 방식의 EPON(Ethernet Passive Optical Network)을 제안한다. OPNET 으로 구현한 시뮬레이션 모델을 이용하여 고순위 및 저순위 트래픽의 비율에 따라 각 트래픽의 최대 및 평균 지연시간, 제안한 알고리즘의 사용율, 분배율을 구하여 적합성을 검증한다.

상용 API 의 감정에 따른 음성 인식 성능 비교 연구 (A Study on the Comparison of the Commercial API for Recognizing Speech with Emotion)

  • 양장훈
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 춘계학술발표대회
    • /
    • pp.52-54
    • /
    • 2023
  • 최근 인공지능 기술의 발전에 따라서 다양한 서비스에서 음성 인식을 활용한 서비스를 제공하면서 음성 인식에 대한 중요성이 증가하고 있다. 이 논문에서는 국내에서 많이 사용되고 있는 대표적인 인공지능 서비스 API 를 제공하는 구글, ETRI, 네이버에 대해서 감정 음성 관점에서 그 차이를 평가하였다. AI Hub 에서 제공하는 감성 대화 말뭉치 데이터 셋의 일부인 음성 테스트 데이터를 사용하여 평가한 결과 ETRI API 가 문자 오류율 (1.29%)과 단어 오류율(10.1%)의 성능 지표에 대해서 가장 우수한 음성 인식 성능을 보임을 확인하였다.

자세 추정을 위한 모션 캡처 데이터 복원 (Restoring Motion Capture Data for Pose Estimation)

  • 윤여수;박현준
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 춘계학술대회
    • /
    • pp.5-7
    • /
    • 2021
  • 자세 추정을 위한 모션 캡처 데이터 파일에는 주변 환경과 움직임의 정도에 따라 부정확한 데이터가 존재할 수 있으므로, 이를 보정하는 작업이 필요하다. 기존에는 직접 후처리 과정을 통해 부정확한 데이터를 복원하였으나, 최근에는 자동화된 방법으로 LSTM, R-CNN 등 다양한 종류의 신경망을 사용한다. 하지만 신경망 기반의 데이터 복원 방법들은 컴퓨터 자원을 많이 요구하므로, 본 논문에서는 신경망 기반의 방법보다 자원 사용량은 낮추면서 데이터 복원율은 유지하는 방법을 제안한다. 제안하는 방법은 자세 측정 데이터(c3d)를 활용하여 부정확한 자세 데이터를 자동으로 복원한다. 실험 결과, 데이터의 부정확한 정도에 따라 89%에서부터 99% 정도의 데이터 복원율을 보였다.

  • PDF

뇌 영상의 형태적 및 기능적 분석을 위한 의료 영상 데이터베이스 (Medical Image Database for Morphometric and Functional Analysis of Brain Images)

  • 김태우
    • 정보처리학회논문지B
    • /
    • 제8B권2호
    • /
    • pp.164-172
    • /
    • 2001
  • 본 논문에서는 시각화와 공간적, 속성 혼합 쿼리를 수행할 수 있는 관계형 데이터베이스를 설계하고 구현하였다. 쿼리에 사용되는 데이터형은 슬라이스, MPR, 볼륨 렌더링으로 시각화할 수 있으며, 쿼리는 아탈라스를 이용하는 경우와 그렇지 않는 경우를모두 고려하였다. 영상 데이터는 공간충전 곡선으로 공간적으로 클러스트링한 후 무손실 압축하여 데이터베이스에 저장된다. 본 논문은 저장 데이터의 양을 줄이기 위하여 관심영역의 크기에 따라 창의 크기가 변하는 적응적 Hibert 곡선을 제안하였으며, 실험에서 Hibert 곡선의 적용한 데이터보다 약 1.15배 높은 압축율을 보였다. 또한 아틀라스에 대한 뇌종양의 공간적 쿼리 결과를 통하여 본 의료 영상 데이터베이스의 유용성을 보였다.

  • PDF

오디오 데이터 인덱싱의 검색 효율 분석 (Retrieval Efficiency Analysis For Audio Data Indexing)

  • 조용춘;이배호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2000년도 추계학술발표논문집 (하)
    • /
    • pp.1297-1300
    • /
    • 2000
  • 본 논문에서는 멀티미디어 데이터 중에서 오디오 데이터의 검색을 위해 Wavelet 변환을 이용한 인덱싱 방법에 대해 서술한다. 오디오 데이터는 그 자신이 가지고 있는 특징 때문에 좋은 검색효율을 위한 인덱스를 구성하기가 까다롭다. 여기서 Wavelet을 이용한 인덱스는 데이터를 블록으로 나누지 않고 인덱싱 하고, 이 방법을 이용한 검색효율에 대해 서술한다. 즉 Wavelet의 마지막 단계의 고주파 부분과 저주파 부분에서 고주파 부분은 String Matching 기법으로 블록을 결정하고, 저주파 부분은 결정된 블록에 대해서 세부적인 비교를 한다. 실험은 적절한 비교 계수를 결정하기 위한 실험과, 질의 길이의 변화에 따른 검색율의 변화를 보여준다. 마지막 결론에서는 본 논문에서 제안한 방법을 이용한 발전방향과 응용에 대해서 서술한다.

  • PDF

XML 데이터의 2단계 인덱싱 기법 (Two-step Indexing Method for XML data)

  • 이범석;황병연
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 춘계학술발표대회
    • /
    • pp.333-335
    • /
    • 2009
  • XML은 웹2.0 환경에서 데이터의 저장과 전달을 위한 역할을 수행하는 필수적인 포맷으로 각광받고 있다. 특히 RSS나 ATOM과 같은 피드기술은 XML을 이용한 성공적인 사례로 인정받고 있다. 이러한 XML 포맷 데이터는 빠른 검색을 위해 경로기반 클러스터링 기법이나 내용기반 클러스터링 기법을 적용하는 것이 일반적이다. 하지만 클러스터링 기법을 적용할 때 주어지는 임계값에 따라 재현율이 변화하게 되고, 검색 결과에서 배제되는 데이터가 발생하게 된다. 이 논문에서는 기존 클러스터링 기법을 적용할 때 발생하는 데이터 배제현상을 보완하는 2단계 인덱싱 기법을 제안하고, 제안한 방법의 성능에 대해 분석한다.

마이데이터를 활용한 주식 추천모델 개발 (Development of Stock Recommendation Model Using Personal MyData)

  • 김예진;임성하;성승연;김효재;류상욱
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 추계학술발표대회
    • /
    • pp.943-945
    • /
    • 2022
  • 2030 세대의 주식시장 참여율은 갈수록 늘어나는 데에 반해 증권업의 높은 진입 장벽과 부족한 정보로 손실을 보는 경우가 적지 않다. 이러한 상황에서 정보의 주체인 개인이 본인 데이터에 대한 권리를 가지고, 본인이 원하는 방식으로 데이터를 관리하는 패러다임인 '마이데이터' 서비스가 최근 떠오르고 있다. 본 논문에서는 위의 문제를 해결하기 위하여 마이데이터를 토대로 특정 주식 종목과 유사한 종목들을 먼저 선별한 후 순수익이 높게 예측되는 종목을 최종 추천하는 모델을 제안한다.

악성코드 탐지를 위한 동적 분석 데이터 전처리 기법 (Dynamic Analytic Data Preprocessing Techniques for Malware Detection)

  • 김해수;김미희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.230-231
    • /
    • 2023
  • 악성코드를 탐지하는 기법 중 동적 분석데이터와 같은 시계열 데이터는 프로그램마다 호출되는 API의 수가 모두 다르다. 하지만 딥러닝 모델을 통해 분석할 때는 모델의 입력이 되는 데이터의 크기가 모두 같아야 한다. 이에 본 논문은 TF-IDF(Term Frequency-Inverse Document Frequency)와 슬라이딩 윈도우 기법을 이용해 프로그램의 동적 특성을 유지하면서 데이터의 길이를 일정하게 만들 수 있는 전처리 기법과 LSTM(Long Short-Term Memory) 모델을 통해 정확도(Accuracy) 95.89%, 재현율(Recall) 97.08%, 정밀도(Precision) 95.9%, F1-score 96.48%를 달성했다.

의료 인공지능 성능 향상을 위한 GAN 기반 희소 질병 데이터 합성 (GAN-Based Synthesis of Sparse Disease Data for Improving Medical AI Performance)

  • 정예림;김소연;이일구
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2024년도 춘계학술발표대회
    • /
    • pp.707-708
    • /
    • 2024
  • 최근 디지털 헬스케어 기술과 서비스가 널리 활용되면서 의료 인공지능 성능 향상에 대한 관심이 높아지고 있다. 그러나 양성 데이터 대비 질병 데이터가 희소하여 학습 과정에서 과적합이 발생하거나 질병 예측 모델의 성능이 떨어진다는 한계가 있다. 본 논문에서는 데이터가 균질하지 않은 상황에서 생성형 인공지능 모델을 사용하여 합성 데이터를 생성하는 방안을 제안한다. 실험 결과에 따르면, 종래 방법 대비 제안한 방법의 정확도가 약 5.8% 향상되었고, 재현율이 약 21% 개선되었다.