• 제목/요약/키워드: 데이터과학자

검색결과 599건 처리시간 0.033초

다차원 색인구조를 이용한 객체지향 데이터베이스의 조율 가능한 클래스 계층 색인기법 (A Tunalbe Class Hierarchy Index for Object -Oriented Databases using a Mulidimensional Index Structure)

  • 이종학;황규영
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제26권3호
    • /
    • pp.365-379
    • /
    • 1999
  • 본 논문에서는 객체지향 데이터베이스의 클래스 계층에 대한 색인기법으로 이차원 색인구조를 이용하여 조율 가능한 이차원 클래스 색인기법인 2D-CHI를 제안한다. 2D-CHI 에서는 색인된 속성의 키값 도메인과 클래스 식별자 도메인으로 구성된 이차원 도메인상의 색인엔트리들에 대한 클러스터링 문제를 다룬다. 클러스터링 특성이 하나의 속성에 의해서 독점되는 B+-Tree 와 같은 일차원 색인구조를 이용하는 기존의 클래스 색인기법들은 특정 형태의 질의에 대해서만 적합한 색인기법들로서 다양한 형태의 질의들로 구성된 질의 패턴에 대해서 적절하게 대응하지 못한다. 2D-CHI에서는 질의 피턴에 따라 키값 도메인과 클래스 식별자 도메인 사이에서 색이 엔트리들의 클러스터링 정도를 조정함으로써 질의처리의 성능을 향상시킨다. 2D-CHI 의 성능평가를 위하여, 먼저 데이터의 균일 분포를 가정으로 비용 모델을 정립하여 기존의 색인기법들과 색인의 성능을 비교한다. 그리고, 계층 그리드 파일을 이용하여 구현한 2D-CHI의 실험으로 비용 모델을 검증하며, 다양한 실험을 통하여 데이터의 분포와 주어진 질의 형태에 따라 최적의 이차원 클래스 계층 색인구조를 구성할 수 있음을 보인다.

BIO 정보 통합 활용을 위한 웹 서비스 기반 멀티 에이전트 플렛폼

  • 김일곤
    • 한국생물정보학회:학술대회논문집
    • /
    • 한국생물정보시스템생물학회 2002년도 제1차워크샵
    • /
    • pp.123-137
    • /
    • 2002
  • 생물정보공학을 위한 학문적/실용적 접근은 전산학, 생물학, 유전공학, 수학/통계학등이 유기적으로 통합되어 이루어져야 한다. 그러나 각계의 전문가가 서로의 특정 지식을 활용하기 위한 물리적인 기반이 갖추어져 있지 않은 상태에서는 각 분야의 전문적 지식 활용이 용이하지 않다. 현재의 의료 서비스 제공자/병원이 가진 방대한 의료 데이터를 생물정보공학 령역에서 활용할 수 있도록 해야 하고, 진료 데이터에 근거한 유전적 정보 분석을 위해 생물학 전문가들이 생성하는 인간 질병에 관한 유전적 분석, 연구 결과를 다시 의료 서비스 제공자에게 돌려주는 순환적 사이클이 필요하고, 이러한 순환적 사이클 지원자는 정보 기술이라고 생각한다. 인간 질병 극복과 좀 더 나은 진료, 예방책을 제공할 수 있도록 생물정보공학, 의료정보학, 컴퓨터과학의 통합 활용 목표를 설정할 수 있다. 각계의 전문가가 지식을 공유할 수 있고 기존의 병원 시스템 및 유전 연구소 등의 시스템을 통합하여 유기적으로 엮음으로써 데이터를 의미 있게 해석하고 공유할 수 있도록 지원하는 프레임워크가 절실히 요구된다. 본 세미나에서는 의료정보학과 생물정보공학에서 활용하는 시스템 통합, 전문 지식의 통합적 활용을 위해 각 전문가를 대신하는 에이전트로 구성된 멀티에이전트 플랫폼을 제시하여, 각 분야가 갖는 전문성 확보, 광고, 유기적 연결을 멀티에이전트 시스템에게 위임함으로써 각 영역에서 서비스 할 수 있는 내용과 서비스 제공 주체인 각계의 전문가 집단을 유기적으로 통합하고자 한다. 의료 영역에서 이루어진 의료 영상 통신 시스템 (Picture Archiving and Communication Systems), 의료 정보 표준화를 위한 HL7 (Health Level 7)에 대해서 경북대학교 지능정보 연구실에서 연구, 개발한 내용을 발표한다. 의료 정보 시스템과 생물학 영역의 유전체 정보 데이터베이스 시스템 사이에 의미 있는 데이터 전송, 지식 획득을 위해 정보 기술 분야에서 활용해야 할 영역으로 XML Web Services, Multi-agent Systems, 전문가 컴뮤니티를 위한 그룹웨어 연구 개발에 관해 사례 중심으로 발표한다.

  • PDF

시점 불변인 특징과 확률 그래프 모델을 이용한 인간 행위 인식 (Human Activity Recognition using View-Invariant Features and Probabilistic Graphical Models)

  • 김혜숙;김인철
    • 정보과학회 논문지
    • /
    • 제41권11호
    • /
    • pp.927-934
    • /
    • 2014
  • 본 논문에서는 Kinect와 같은 RGB-D 센서를 이용하여 사람의 3차원 신체 포즈 스트림 데이터를 생성하고, 이로부터 사람의 일상 행위를 효과적으로 인식하는 방법을 제안한다. Kinect SDK나 OpenNI에서 제공하는 실시간 신체 포즈 데이터는 Kinect 중심의 3차원 데카르트 좌표계로 표현되기 때문에, 시점 변화 문제와 크기 변화 문제를 겪을 가능성이 높다. 이러한 문제를 해결하고 시점 및 크기 불변인 특징을 얻기 위해, 본 논문에서는 신체 포즈 데이터를 실험자의 골반을 원점으로 하는 구면 좌표계로 변환하고 실험자의 팔 길이를 이용한 크기 정규화를 수행한다. 또한, 본 논문에서는 확률 그래프 모델 중 하나인 은닉 조건부 랜덤 필드를 이용하여, 고수준의 일상 행위들이 내포하는 다양한 내부 구조를 효과적으로 표현한다. 두 가지 데이터 집합 KAD-70과 CAD-60을 이용한 실험을 통해, 본 논문에서 제안한 행위 인식 방법과 구현 시스템의 높은 인식 성능을 확인하였다.

3GPP2 IMT-2000 시스템에서 멀티캐스트 전달 대리자 기반의 새로운 Mobile-IPv6 멀티캐스트 라우팅 프로토콜 (A New Multicast Routing Protocol for Multicast Delivery Agent-based Mobile-IPv6 in 3GPP2 IMT-2000 System)

  • 박병섭;김성수
    • 한국정보과학회논문지:정보통신
    • /
    • 제29권1호
    • /
    • pp.15-23
    • /
    • 2002
  • 본 논문에서는 3GPP2 IMT-2000 서비스를 위해 기존 음성 및 인터넷 인프라를 수용할 수 있으며, IMT-2000망에서 Mobile-IP over IMT-2000 멀티미디어 응용 서비스를 제공하는데 필수적인 MDA(Multicast Delivery Agent)-기반의 Mobile-IPv6 멀티캐스트 알고리즘을 제안하고 이를 분석한다. IMT-2000 시스템 모델은 PDSN(Packet Data Serving Node) 또는 IWF(Interworking Function)기능이 각 기지국에 존재하는 분산된 모델을 사용한다. 새로운 프로토콜의 핵심요소는 멀티캐스트 데이터그램 전달 경로를 줄이기 위해 MDA (Multicast Delivery Agent)를 도입한 것이다. 제안된 프로토콜은 현재까지 제안된 이동망에서 멀티캐스트 지원 기법들과 비교하여, 짧은 라우팅 경로 및 이동 호스트에 근접한 노드에서 이동 호스트로의 직접 데이터그램 전송을 통하여 성능 향상을 기대할 수 있다. 특히, 터널링 수 및 멀티캐스트 데이터그램의 평균 라우팅 길이가 감소하고, 멀티캐스트 데이터그램의 트래픽 부하도 감소한다.

자동측정망 데이터를 활용한 국내 호소 실시간 수질지수 평가 (RTWQI(Real Time Water Quality Index) evaluation of domestic lakes using automatic measurement network data)

  • 김선웅;홍은미
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2022년도 학술발표회
    • /
    • pp.174-174
    • /
    • 2022
  • 수질지수는 여러 수질 데이터 값을 수학적으로 결합하고 다 변수 특성을 줄여 수치 및 등급으로 나타낸 지표이다. 수질지수를 통해 수질을 평가하고 서로 다른 위치와 시간의 수역을 종합적으로 비교할 수 있으며 수자원관리에 있어 정책입안자, 의사결정자, 국민이 수질에 대해 일반적이고 쉽게 이해할 수 있다. 현재 환경부에서는 국내수질자동측정망 최근 12시간 데이터 값을 근거로 실시간수질지수 RTWQI(Real-Time Water Quality)값을 제공한다. 국내 호소에 설치된 수질 자동측정망은 총 8개소이며 매 시간 공통 항목인 수온, pH, DO, 전기전도도, TOC 5개, 선택항목인 탁도, Chl-a, TN, TP, 중금속, 생물감시항목 등 27개를 측정한다. RTWQI는 캐나다에서 2001년에 개발된 CCME WQI(Canadian Council of Ministers of the Environment Water Quality Index) 산출식을 기초하였으며 F1(기준치를 위반하는 수질항목의 개수/ 총 수질항목 개수), F2(기준치를 위반한 샘플들의 총 횟수/총 샘플횟수) F3(기준치를 위반한 정도) 3가지의 요소로 계산된다. 그러나RTWQI 산출식의 기초인 CCME WQI는 개발 이후 여러 문제점들은 개선되었으나 F1이 다른 F2, F3 보다 CCME WQI 점수의 기여도가 2배 이상 높은 문제점은 개선하지 못하였다. 본 연구에서는 수질자동측정망이 설치된 2012년 7월부터 2021년 12월 동안 매 시간 별 수질 데이터를 이용하였다. 또한 CCME WQI 문제점을 개선한 MWQI(Modification of Canadian water qaulity index)를 기초하여 실시간 수질지수를 재 산정하였다. 추가적으로 Pearson 상관관계 분석 및 추가 통계분석을 통해 환경부에서 제공하는 기존의 RTWQI, 개선된 실시간수질지수, 한국형 호소수질평가지수 LQI(Lake Water Quality Index)를 비교 및 평가하였다. 이러한 연구를 통해 정확성 높은 수질지수를 찾고 수자원 관리 정책 수립에 적극 활용 될 수 있을 것으로 사료된다.

  • PDF

국내 대학도서관의 연구데이터관리서비스 개발 방안에 관한 연구: 서울대학교 소속 연구자들의 요구 분석을 중심으로 (A Study on the Development of Research Data Management Service in a Domestic University Library: Focused on the Analysis on the Needs of Researchers Affiliated in Seoul National University)

  • 심윤희;김지현
    • 정보관리학회지
    • /
    • 제36권3호
    • /
    • pp.61-80
    • /
    • 2019
  • 본 연구는 대학도서관의 연구데이터관리서비스 개발을 위하여 수행되었다. 본 연구에서는 연구데이터관리서비스의 요소와 제공 수준을 알아보고, 국내에서 연구비 규모가 가장 큰 대학인 서울대학교 소속 연구자들을 대상으로 인터뷰를 진행하여 연구자들의 연구데이터관리 및 공유와 이용, 서비스에 대한 요구를 분석하였다. 인터뷰 참여자들은 해외 연구비지원기관 또는 학술 저널에서 제시하는 데이터 공유 의무조항에 대한 인식과 이행 경험이 부족하고 데이터를 체계적으로 관리하는데 어려움을 겪고 있었다. 그러나 상당수의 연구자들이 데이터 관리 및 연구데이터관리서비스 관련 교육에 대한 필요성에 대해 동감하고 있었다. 이를 바탕으로, 연구데이터관리서비스를 교육서비스, 전문 컨설팅 서비스, 큐레이션 기술 서비스 요소로 나누어 각 요소별 이용자의 요구를 반영한 서비스를 제안하였다. 본 연구결과는 향후 국내 대학도서관 및 연구데이터관리서비스를 계획하고 있는 기관에서 서비스 개발의 기초자료로 활용할 수 있을 것이다.

평점 분리 기법을 이용한 e마켓플레이스의 판매자 평판 계산 방안 (A Method of Seller Reputation Computation Based on Rating Separation in e-Marketplace)

  • 오현교;노유한;김상욱;박선주
    • 정보과학회 논문지
    • /
    • 제42권10호
    • /
    • pp.1286-1293
    • /
    • 2015
  • e-마켓플레이스는 구매자들이 보다 신뢰할 수 있는 판매자와 거래할 수 있도록 평판 시스템(Reputation system)을 구축하여 예비 소비자들에게 판매자의 평판을 제공한다. 판매자의 평판은 소비자의 평점을 기반으로 산출되는데 이 때 소비자의 평가 요소로는 판매자의 행동에 대한 평가와 상품에 대한 평가가 있다. 기존의 평판 계산 방안들은 구매자의 평점이 두 가지의 평가가 혼합된 점수라는 것을 인지하지 못한 채로 판매자의 평판을 산출한다. 본 논문에서는 소비자 평점을 판매자 점수와 상품 점수로 분리한 후 오직 '판매자의 점수'만을 이용하는 평판 계산 방안을 제안한다. 제안하는 방안은 판매자의 점수만을 이용하여 판매자의 능력에 대한 평판만을 제공하는 방안으로 예비 소비자들이 빠른 배송과 친절한 서비스를 제공하는 판매자를 선택할 수 있도록 돕는다. 실험에서는 실제 e-마켓 플레이스의 현실성을 반영한 시뮬레이션 방안을 제안한다. 생성된 시뮬레이션 데이터를 기반으로 진행하는 실험을 통해 제안하는 방법의 우수성을 입증한다.

가변 길이 정보 메시지 최적화 방법 (An optimization method for variable length information messages)

  • 김진규;강성원;정필수;김정민;백하은;권구형;김상수
    • 소프트웨어공학소사이어티 논문지
    • /
    • 제26권1호
    • /
    • pp.1-16
    • /
    • 2013
  • 가변 길이 정보 메시지는 컴퓨터 네트워크 시스템을 통하여 효율적인 정보 제공을 하기 위하여 개발된 통신 프로토콜 표준이다. 이러한 가변 길이 정보 메시지는 정보 수신자의 정보 요구 수준 및 정보 수신자의 정보 접근 수준에 따라 정보의 상세함을 가변적으로 조절 할 수 있도록 설계된 메시지이다. 정보 메시지 최적화 기술은 정보 메시지를 다양한 데이터 압축 기술을 사용하여, 메시지 전체의 물리적인 사이즈를 줄이려고 노력하였다. 정보 메시지 최적화에서는 정보의 정확성을 최우선으로 고려하고 있어, 최적화 전/후가 동일한 비손실 압축 기법을 응용하여 사용하고 있다. 하지만, 이러한 비손실 압축 기법만을 사용하면, 압축효율성이 현저하게 떨어져, 제한된 대역폭을 갖는 무선 네트워크 환경에서의 효율적인 전송이 이루어지지 않는다. 본 논문에서는 가변 길이 정보 메시지를 대상으로, 메시지 필드 단위로 정보의 최적화를 수행하여 메시지의 길이를 물리적으로 좀 더 효과적으로 최적화하도록 시도하였다. 또한, 본 논문에서 제시한 최적화 방법의 효율성을 보이기 위하여, 가변 길이 정보 메시지에 대한 최적화 실험을 수행하였다.

  • PDF

항법소프트웨어 Software Product Line 프레임워크 운영개념 (Operational Concept for the Software Product Line Framework of Navigation Software)

  • 박삼준;노성규;김도형;이순주;박병수;이인섭
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제10권6호
    • /
    • pp.201-210
    • /
    • 2021
  • 무기체계에 탑재되는 항법소프트웨어의 기능요소들은 다양한 무기체계에 공통적으로 활용될 수 있는 가능성이 높은 것으로 식별되었다. 무기체계 항법소프트웨어 SPL 프레임워크는 다양한 무기체계에 적용되는 항법소프트웨어가 갖는 공통의 기능들을 표준화된 플랫폼으로 개발 및 관리하고, 이를 이용하여 유도무기, 무인기, 잠수함 등의 체계별 항법소프트웨어를 개발하는 방법론을 말한다. 본 논문에서는 SPL 기반 항법소프트웨어 개발 프로세스와 통합개발환경을 제시하고, SPL 프레임워크의 운영개념에 대해 설명한다. 프로세스에 관여하게 되는 참여자의 역할을 정의하고 각 역할자별 활동 시나리오를 도출함으로써 SPL 프레임워크의 운영개념을 정의한다. 제시한 운영개념은 여타 도메인에 SPL을 실현하기 위한 구체적인 지침 마련에 활용될 수 있을 것이다.

마이크로어레이 데이터의 기호코딩을 통한 유의한 후보 유전자 검출 (Candidate Significant Gene Recommendation with Symbolic Encoding of Microarray Data)

  • 이건명;이혜리;김원재;윤석중;김용준;정필두;김은정
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2007년도 춘계학술대회 학술발표 논문집 제17권 제1호
    • /
    • pp.417-420
    • /
    • 2007
  • 마이크로어레이는 생명과학 분야에서 사용되는 대규모의 유전자 발현정도를 동시에 측정할 수 있는 도구이다. 마이크로어레이 실험은 많은 양의 데이터를 생성하기 때문에, 자동화된 효과적인 분석기법이 필요하다. 이 논문에서는 약물의 영향 분석을 위해 약물의 투여량 및 투여후의 시간대별로 샘플을 추출하여, 마이크로어레이를 이용하여 유전자의 발현량을 분석하는 경우에, 약물에 대해서 반응하는 유전자를 추출하는 데이터 마이닝 기법을 제안한다. 제안한 방법에서는 유전자의 발현정도값을 이전 시간의 값을 기준값으로 하여 증가, 감소, 답보에 해당하는 기호로 매핑하여, 분석자가 원하는 패턴을 보이는 유전자를 추천한다. 한편, 유전자의 상호간에 많은 영향을 주고 받기 때문에 특정 약물을 투여할 때, 이에 직접적인 영향을 받는 것도 있지만, 이와는 전혀 상관없이 동작하는 것도 있기 때문에, 제안한 방법에서는 이러한 약물 투여와 유의성이 있을 가능성이 있는 유전자만을 전처리과정을 통해서 필터링하는 기법을 활용한다. 제안한 방법은 실제 약물 투여 실험 샘플에 대한 마이크로어레이 데이터에 적용하여 활용가능성을 확인하였다.

  • PDF