• 제목/요약/키워드: 테스트 데이터 생성

검색결과 342건 처리시간 0.025초

타임라인데이터를 이용한 트위터 사용자의 거주 지역 유추방법 (Location Inference of Twitter Users using Timeline Data)

  • 강애띠;강영옥
    • Spatial Information Research
    • /
    • 제23권2호
    • /
    • pp.69-81
    • /
    • 2015
  • SNS사용자의 거주 지역을 유추하여 그들이 생성한 데이터에 거주위치를 부여하는 것은 위치희박(location sparsity)과 생태학적 오류문제로 인해 연구결과의 신뢰성이 떨어진다는 평가를 받아온 공간빅데이터 연구에 대안이 될 수 있다. 본 연구에서는 Tweet 사용자의 거주 지역을 유추하는 방법으로 사용자 타임라인데이터 속에서 찾아낸 일상생활활동패턴을 이용하는 방법을 고안하였다. 트윗 사용자의 일상생활활동패턴은 이동궤적과 사용자의 언어(text)에서 확인할 수 있었으며 전자를 활용한 모델을 일상이동패턴모델, 후자를 활용한 모델을 일상 활동장 모델이라 명명하고 각각 모델에 입력될 변수를 선정하였다. 자신의 거주 지역에서 가장 높은 빈도의 트윗 발생 여부와 가장 높은 빈도의 거주행정구역 표현 단어를 사용하는지 아닌지를 종속변수로 한 판별분석을 실시하여 모델을 작성하였으며 설명력은 일상 이동패턴모델, 일상 활동장 모델 각각 67.5%, 57.5%였다. 이 모델을 스트레스 관련 트윗을 작성한 사용자의 타임라인데이터로 구성된 테스트데이터에 입력해본 결과 전체 사용자 48,235명 중 5,301명의 거주 지역을 유추하였고 이를 활용하여 위치 부여된 스트레스 관련 트윗 9,606개를 확보하였다. 본 연구의 유추기법을 통해 기존 SNS데이터 분석연구에서 사용하는 데이터 수집 방법보다 44배 많은 위치 부여 트윗을 확보할 수 있었다. 본 연구방법론은 SNS데이터를 이용한 연구에서 위치 부여된 데이터를 확보하는데 활용 가능할 것으로 판단되며, 각종 지역통계와 상관관계파악을 통해 지역적 현상 분석에도 SNS데이터를 이용할 수 있는 가능성을 높일 것으로 판단된다.

천문 고문헌 특화 인공지능 자동번역 서비스 시스템 개발 연구 - 시스템 요구사항 분석 및 설계 위주 (Study on the development of automatic translation service system for Korean astronomical classics by artificial intelligence - Focused on system analysis and design step)

  • Seo, Yoon Kyung;Kim, Sang Hyuk;Ahn, Young Sook;Choi, Go-Eun;Choi, Young Sil;Baik, Hangi;Sun, Bo Min;Kim, Hyun Jin;Lee, Sahng Woon
    • 천문학회보
    • /
    • 제44권2호
    • /
    • pp.62.2-62.2
    • /
    • 2019
  • 한국의 고천문 자료는 삼국시대 이후 근대 조선까지 다수가 존재하여 세계적으로 드문 기록 문화를 보유하고 있으나, 한문 번역이 많이 이루어지지 않아 학술적 활용이 활발하지 못한 상태이다. 고문헌의 한문 문장 번역은 전문인력의 수작업에 의존하는 만큼 소요 시간이 길기에 투자대비 효율성이 떨어지는 편이다. 이에 최근 여러 분야에서 응용되는 인공지능의 적용을 대안으로 삼을 수 있으며, 초벌 번역 수준일지라도 자동번역기의 개발은 유용한 학술도구가 될 수 있다. 한국천문연구원은 한국정보화진흥원이 주관하는 2019년도 Information and Communication Technology 기반 공공서비스 촉진사업에 한국고전번역원과 공동 참여하여 인공신경망 기계학습이 적용된 고문헌 자동번역모델을 개발하고자 한다. 이 연구는 고천문 도메인에 특화된 인공지능 기계학습 기법으로 자동번역모델을 개발하여 이를 서비스하는 것을 목적으로 한다. 연구 방법은 크게 4가지 개발을 진행하는 것으로 나누어 볼 수 있다. 첫째, 인공지능의 학습 데이터에 해당되는 '코퍼스'를 구축하는 것이다. 이는 고문헌의 한자 원문과 한글 번역문이 쌍을 이루도록 만들어 줌으로써 학습에 최적화한 데이터를 최소 6만 개 이상 추출하는 것이다. 둘째, 추출된 학습 데이터 코퍼스를 다양한 인공지능 기계학습 기법에 적용하여 천문 분야 특수고전 도메인에 특화된 자동번역 모델을 생성하는 것이다. 셋째, 클라우드 기반에서 참여 기관별로 소장한 고문헌을 자동 번역 모델에 기반하여 도메인 특화된 모델로 도출 및 활용할 수 있는 대기관 서비스 플랫폼 구축이다. 넷째, 개발된 자동 번역기의 대국민 개방을 위해 웹과 모바일 메신저를 통해 자동 번역 서비스를 클라우드 기반으로 구축하는 것이다. 이 연구는 시스템 요구사항 분석과 정의를 바탕으로 설계가 진행 또는 일부 완료되어 구현 중에 있다. 추후 이 연구의 성능 평가는 자동번역모델 평가와 응용시스템 시험으로 나누어 진행된다. 자동번역모델은 평가용 테스트셋에 의한 자동 평가와 전문가에 의한 휴먼 평가에 따라 모델의 품질을 수치로 측정할 수 있다. 또한 응용시스템 시험은 소프트웨어 방법론의 개발 단계별 테스트를 적용한다. 이 연구를 통해 고천문 분야가 인공지능 자동번역 확산 플랫폼 시범의 첫 케이스라는 점에서 의의가 있다. 즉, 클라우드 기반으로 시스템을 구축함으로써 상대적으로 적은 초기 비용을 투자하여 활용성이 높은 한문 문장 자동 번역기라는 연구 인프라를 확보하는 첫 적용 학문 분야이다. 향후 이를 활용한 고천문 분야 학술 활동이 더욱 활발해질 것을 기대해 볼 수 있다.

  • PDF

이동 평균 기반 동적 시간 와핑 기법을 이용한 시계열 키워드 데이터의 분류 성능 개선 방안 (Enhancing Classification Performance of Temporal Keyword Data by Using Moving Average-based Dynamic Time Warping Method)

  • 정도헌
    • 정보관리학회지
    • /
    • 제36권4호
    • /
    • pp.83-105
    • /
    • 2019
  • 본 연구는 시계열 특성을 갖는 데이터의 패턴 유사도 비교를 통해 유사 추세를 보이는 키워드를 자동 분류하기 위한 효과적인 방법을 제안하는 것을 목표로 한다. 이를 위해 대량의 웹 뉴스 기사를 수집하고 키워드를 추출한 후 120개 구간을 갖는 시계열 데이터를 생성하였다. 제안한 모델의 성능 평가를 위한 테스트 셋을 구축하기 위해, 440개의 주요 키워드를 8종의 추세 유형에 따라 수작업으로 범주를 부여하였다. 본 연구에서는 시계열 분석에 널리 활용되는 동적 시간 와핑(DTW) 기법을 기반으로, 추세의 경향성을 잘 보여주는 이동평균(MA) 기법을 DTW에 추가 적용한 응용 모델인 MA-DTW를 제안하였다, 자동 분류 성능 평가를 위해 k-최근접 이웃(kNN) 알고리즘을 적용한 결과, ED와 DTW가 각각 마이크로 평균 F1 기준 48.2%와 66.6%의 최고 점수를 보인 데 비해, 제안 모델은 최고 74.3%의 식별 성능을 보여주었다. 종합 성능 평가를 통해 측정된 모든 지표에서, 제안 모델이 기존의 ED와 DTW에 비해 우수한 성능을 보임을 확인하였다.

구글어스와 공간데이터베이스를 이용한 웹기반 지리정보 표출시스템 개발 (Development of a Web-based Geovisualization System using Google Earth and Spatial DBMS)

  • 임우혁;이양원;서용철
    • Spatial Information Research
    • /
    • 제18권4호
    • /
    • pp.141-149
    • /
    • 2010
  • 최근 웹 GIS에 있어 큰 흐름 중의 하나는 오픈소스 소프트웨어 (Free and Open Source Software: FOSS)를 이용한 시스템 구축이다. 지리정보를 웹에서 처리하는데 있어서 오픈소스 소프트웨어의 등장은 기존 상용소프트웨어의 기술에 의존하지 않으면서, 구현모듈의 재사용과 시스템 확장성을 증대시키고 있다. 본 연구에서는 오픈소스 공간데이터베이스인 PostgreSQL/PostGIS와 동적상호작용을 지원하는 구글어스를 이용하여 지리정보의 효율적인 사각화를 위한 웹기반의 지리정보 표출시스템을 설계 및 구현하였다. 본 시스템의 지도 시각화는 구글어스 플러그인 및 API(application programming interface)를 이용하여 구현하였으며, 사용자의 요구에 따라 동적으로 데이터를 KML(Keyhole Markup Language)로 자동 생성하여 구글어스 상에 다양한 지리적 형태로 시각화 할 수 있는 자바 모듈(KML Generator)을 구현하였다. 프로토타입 시스템은 우리나라의 LAI(leaf area index), 임상도 및 정곡생산량 데이터를 이용하여 테스트되었으며 본 연구에서 설계 및 구현된 웹기반의 지리정보 표출 시스템이 다양한 지리공간데이터의 시각화에 적용될 수 있는 가능성을 제시하였다.

OpenRISC 기반 멀티미디어 SoC 플랫폼의 ASIC 설계 (ASIC Design of OpenRISC-based Multimedia SoC Platform)

  • 김선철;류광기
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2008년도 추계종합학술대회 B
    • /
    • pp.281-284
    • /
    • 2008
  • 본 논문에서는 멀티미디어 SoC 플랫폼의 ASIC 설계에 대해 기술한다. 구현된 플랫폼은 32비트 OpenRISC1200 마이크로프로세서, WISHBONE 온 칩 버스, VGA 제어기, 디버그 인터페이스, SRAM 인터페이스 및 UART로 구성된다. 32 비트 OpenRISC1200 프로세서는 명령어 버스와 데이터 버스가 분리된 하버드 구조와 5단 파이프라인 구조를 가지고 VGA 제어기는 메모리로부터 읽은 이미지 파일에 대한 데이터를 RGB 값으로 CRT 혹은 LCD에 출력한다. 디버그 인터페이스는 플랫폼에 대한 디버깅 기능을 지원하고 SRAM 인터페이스는 18비트 어드레스 버스와 32비트 데이터 버스를 지원한다. UART는 RS232 프로토콜을 지원하는 시리얼 통신 기능을 제공한다. 본 플랫폼은 Xilinx VIRTEX-4 XC4VLX80 FPGA에 설계 및 검증되었다. 테스트 코드는 크로스 컴파일러로 생성되었고 JTAG 유틸리티 소프트웨어와 gdb를 이용하여 패러럴 케이블을 통해 FPGA 보드로 다운로드 하였다. 이 플랫폼은 최종적으로 Chartered 0.18um 공정을 이용하여 단일 ASIC 칩으로 구현 되었으며 100MHz 클록에서 동작함을 확인하였다.

  • PDF

3D 그래픽 모델을 활용한 교량 시설물 유지관리 시스템 (Application of a 3D Graphic Model for Bridge Maintenance)

  • 문성우;김상도;박미경
    • 한국건설관리학회논문집
    • /
    • 제12권2호
    • /
    • pp.64-71
    • /
    • 2011
  • 건설공사의 규모가 대형화, 복합화 되어감에 따라서 유지관리의 중요성이 더욱 커지고 있다. 유지관리의 효과를 높이기 위해서는 유지관리단계의 정보뿐만 아니라 설계 시공단계에서 생성된 정보를 신속하게 조회하고 활용할 수 있어야 한다. 본 논문에서는 3D 그래픽 모델을 활용한 교량 구조물 유지관리 정보 시스템을 제시한다. 3D 환경의 유지관리 정보 시스템은 시설물 부재의 속성정보를 저장하고, 이와 관련하여 데이터베이스에 저장되어 있는 데이터를 추출함으로써 필요한 자료를 신속하게 조회할 수 있다. 연구의 목적을 달성하기 위해서 캐드와 웹 환경으로 구성된 프로토타입을 개발했다. 개발된 프로토타입을 적용하여 테스트한 결과 유지관리자는 웹 환경에서 사무실과 현장에서 필요한 데이터를 찾을 수 있으며, 작업 시 실시간으로 데이터를 활용하여 유지관리의 시간을 단축하고, 의사결정의 정확성을 높일 수 있는 것으로 나타났다.

Support Vector Machine을 이용한 생체 신호 분류기 개발 (Development of a Clinical Decision Support System Utilizing Support Vector Machine)

  • 홍동권;채용웅
    • 한국전자통신학회논문지
    • /
    • 제13권3호
    • /
    • pp.661-668
    • /
    • 2018
  • 피부 저항을 이용한 생체 신호는 스트레스성 질환에 따라 각각 다른 특성을 보이고 있으며 이 특성을 이용하여 스트레스성 질환을 진단하는 생체진단 장비들이 개발 되었으며, 장비들은 피부 저항 측정기에서 측정한 신호를 해석하기 쉽게 출력해주며, 그 분야의 전문가는 출력 신호를 직접 보고 어떤 스트레스성 질환의 가능성이 높은지를 판단하게 된다. 하지만 각 측정 대상자에게서 측정된 생체 신호를 분석하여 측정 대상자가 어떤 스트레스성 질환을 가지고 있는지를 사람이 정확히 판단하기는 매우 어려울 뿐만 아니라 판단의 결과가 잘못될 가능성도 매우 높다. 이런 문제점을 해결하기 위하여 본 연구에서는 머신러닝 기법을 이용하여 측정된 신호가 어떤 스트레스성 질환의 신호에 해당하는지를 판단하는 기능을 구현하였다. 측정 장비의 낮은 컴퓨팅 능력을 고려하여 분류 기법은 SVM을 사용하였으며, 훈련 데이터와 테스트 데이터는 13개의 질환을 중심으로 오차범위 5를 사용하여 각 질환 당 1,000개를 랜덤하게 생성하여 사용하였다. 모의실험 결과에서 90% 이상의 판단 정확도를 보였으며 앞으로 측정 장비가 실제로 환자들에게 적용되면 다시 생성된 데이터로 분류기를 재훈련 할 수 있게 구성하였다.

모바일용 지하공간통합지도 제공 플랫폼 활용을 위한 기반 기술 연구 (Reserch On The Fundamental Technology To Utilization Of Platform To Providing Mobile Underground Geospatial Infomation Map)

  • 이태형;김현우
    • 한국지리정보학회지
    • /
    • 제23권4호
    • /
    • pp.173-183
    • /
    • 2020
  • 도심지 지하시설물 노후화가 진행되고, 도로 굴착 안전사고에 불안이 형성되고 있는 가운데, 국토교통부에서는 「지반침하 예방대책」과 지하공간의 효율적 활용방안의 일환으로 2015년부터 지하공간통합지도를 구축하기 시작하여 그 범위를 매년 확산하고 있다. 현행 지하공간통합지도 정보는 웹기반으로 데스크탑 환경에서 운용되고 있는 바, 굴착 공사장과 같은 현장 환경에서의 활용에는 제한되는 부분이 있는 것이 사실이다. 웹기반 환경에서 구축 운영되고 있는 지하공간통합지도는 대용량 3차원 데이터이다. 따라서 데이터를 현장으로 지체 없이 전송하여 서비스하기 위해서는 지하공간통합지도 데이터를 가볍게 할 방안이 필요하다. 또한 현재 지하공간통합지도는 3DS, COLLADA등 데이터포맷이 일원화 되어있지 않으며, 좌표체계 방식도 상대좌표, 절대좌표 등으로 상이하다. 본 연구에서는 국내외 선행연구와 기술적용 사례를 분석하여 모바일용 지하공간통합지도 데이터포맷 및 경량화 방법을 제시하고, 제시된 포맷의 모바일용 지하공간통합지도를 생성할 수 있는 기술 개발을 실시하였다. 또한 현장에서 빠르게 데이터를 전송받을 수 있도록 3차원 데이터 압축기술을 적용하여 경량화율을 테스트해 보았으며, 현장에서 압축된 3D 데이터를 해제하여 활용할 수 있는 기술개발을 하였다. 아울러 향후 본 연구에서 실험적으로 개발한 기술을 보완하고 추가 연구실시하여 굴착현장에서 활용할 수 있는 소프트웨어로 제작하여 활용에 쓰이는 것을 목표로 한다.

다채널 스피커 시스템을 위한 오디오 신호지 직렬 전송 (Serial Transmission of Audio Signals for Multi-channel Speaker Systems)

  • 권오균;송문빈;이승원;이영원;정연모
    • 한국음향학회지
    • /
    • 제24권7호
    • /
    • pp.387-394
    • /
    • 2005
  • 본 논문에서는 다채널 오디오 시스템의 스피커들을 직렬로 연결하기 위한 새로운 오디오 신호 전송 기법을 제시한다. 다채널 오디오 본체로부터의 아날로그 신호는 디지털 신호로 변환되고 신호 처리 과정을 거쳐서 직렬로 연결된 각 스피커에 전달된다. 여기서 신호 처리 과정은 오디오 신호의 특성을 고려한 데이터 압축과 전송을 위한 패킷 생성을 포함한다. 각 스피커는 전달된 패킷으로부터 해당하는 디지털 신호만을 검출하여 아날로그 신호로 다시 변환하여 음향을 재생한다. 제시된 모든 기능은 VHDL을 사용하여 모델링되었으며 FPGA 칩으로 구현하였고 실제 다채널 오디오 시스템에서 테스트하였다.

범용 그래픽스 하드웨어 기반 여과후 역투사 최적화 기법에 관한 연구 (An Optimized GPU based Filtered Backprojection method)

  • 박종현;이병훈;이호;신영길
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2009년도 학술대회
    • /
    • pp.436-442
    • /
    • 2009
  • 삼차원 재구성 기법은 대상을 파괴하지 않고도 그 내부 구조의 공간적 해석을 가능하게 해주는 단층 영상을 생성해주기 때문에, 산업, 의료분야에서 널리 사용되고 있다. 최근 영상 장비의 성능 향상으로 고해상도의 CT 영상을 얻을 수 있게 되었으나, 대용량 데이터를 재구성하기 위해 많은 시간이 소요된다. 본 논문에서는 재구성에서 가장 많은 시간이 소요되는 여과와 역투사 과정을 범용 그래픽스 하드웨어를 사용하여 최적화하는 방법을 제안한다. 여과에서는 네 장의 영상을 압축하여 동시에 처리하는 기법을 적용하고, 역투사 과정에서는 깊이 테스트를 이용하여 계산량을 줄이는 방법을 사용한다. 제안된 방법으로 구현된 GPU 기반 프로그램은 OpenMP 를 사용하여 최적화 된 CPU 기반 프로그램에 비해 약 50 배 이상 속도가 향상되었다.

  • PDF