• 제목/요약/키워드: 데이터 기반 분석

검색결과 10,023건 처리시간 0.047초

연관분석에 기반한 건강검진결과 시각화 방법 (Association Mining based Visualization Method for Health Examination Results)

  • 김준우;박상찬
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2014년도 제49차 동계학술대회논문집 22권1호
    • /
    • pp.281-282
    • /
    • 2014
  • 병의원에서 다양한 정보시스템을 도입하면서 환자들과 관련된 방대한 의료 데이터들이 전자적인 형태로 축적되어 왔고, 최근에는 의료진이나 환자에게 적절한 정보를 제공하는데 이러한 데이터를 활용하고자 하는 노력이 이어지고 있다. 그러나 의료 데이터는 분량이 방대하고 전문적인 내용을 다루기 때문에 이에 기반한 정보를 개인 환자에게 제공하는데 있어서는 데이터에 포함된 내용을 사용자의 이해가 편리한 형태로 가공하는 것이 중요하다. 이에 본 논문에서는 연관분석과 관련된 행렬 기반 표현 방법을 기반으로 한 하이브리드 시각화 방법을 개발하고, 이를 건강검진 결과에 적용하는 것을 제안하고자 한다.

  • PDF

하둡 맵리듀스와 페이지 랭크를 이용한 서울시 대중 교통 인구 이동 분석 (Analysis of the population flow of public transportation in Seoul using Hadoop MapReduce and PageRank algorithm)

  • 백민석;오상윤
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 추계학술발표대회
    • /
    • pp.354-356
    • /
    • 2022
  • 소셜 네트워크 및 웹 데이터와 같은 대규모 그래프 데이터를 처리하기 위해 병렬 처리 기반의 기법들이 많이 사용되어 왔다. 본 연구에서는 그래프 형식의 대규모 교통 데이터를 하둡 맵리듀스를 이용하여 처리하는 효과적인 기법을 제안한다. 제안하는 방식에서는 도시의 유동 인구 흐름을 가중치로 고려할 수 있도록 Weighted PageRank 알고리즘을 기반으로 하는 병렬 그래프 알고리즘을 사용하며, 해당 알고리즘을 하둡 맵리듀스에 적용하여 주거 및 근무지 등의 지역을 분류하도록 결과를 분석하였다. 제안 기법을 통한 분석 결과를 기반으로 지역 간 유동 인구 그래프 데이터에서 각 도시의 영향력을 측정하는 페이지랭크, 하둡 맵리듀스 기반의 기법을 제시한다.

빅데이터 로그를 이용한 실시간 예측분석시스템 설계 및 구현 (Real time predictive analytic system design and implementation using Bigdata-log)

  • 이상준;이동훈
    • 정보보호학회논문지
    • /
    • 제25권6호
    • /
    • pp.1399-1410
    • /
    • 2015
  • 기업들은 다가오는 데이터 경쟁시대를 이해하고 이에 대비해야 한다며 가트너는 기업의 생존 패러다임에 많은 변화를 요구하고 있다. 또한 통계 알고리즘 기반의 예측분석을 통한 비즈니스 성공 사례들이 발표되면서, 과거 데이터 분석에 따른 사후 조치에서 예측 분석에 의한 선제적 대응으로의 전환은 앞서가고 있는 기업의 필수품이 되어 가고 있다. 이러한 경향은 보안 분석 및 로그 분석 분야에도 영향을 미치고 있으며, 실제로 빅데이터화되고 있는 대용량 로그에 대한 분석과 지능화, 장기화되고 있는 보안 분석에 빅데이터 분석 프레임워크를 활용하는 사례들이 속속 발표되고 있다. 그러나 빅데이터 로그 분석 시스템에 요구되는 모든 기능 및 기술들을 하둡 기반의 빅데이터 플랫폼에서 수용할 수 없는 문제점들이 있어서 독자적인 플랫폼 기반의 빅데이터 로그 분석 제품들이 여전히 시장에 공급되고 있다. 본 논문에서는 이러한 독자적인 빅데이터 로그 분석 시스템을 위한 실시간 및 비실시간 예측 분석 엔진을 탑재하여 사이버 공격에 선제적으로 대응할 수 있는 프레임워크를 제안하고자 한다.

온라인게임 분야의 Data-driven Security

  • 김휘강
    • 정보보호학회지
    • /
    • 제30권5호
    • /
    • pp.101-109
    • /
    • 2020
  • 온라인게임은 부정로그인 및 게임봇 (Game BOT) 탐지 등 서비스에 악영향을 주는 이상징후를 조기에 탐지해야 하는 서비스 분야이다 보니, 데이터기반 보안 (Data-Driven Security)이 상당히 오랜 기간 자생적으로 구축이 되어왔다. 온라인 게임은 초당 동시접속이 800만~1천만에 육박하는 게임도 시장에 빈번히 존재하기 때문에, 게임유저들의 로그데이터를 빅데이터 기술을 접목한 데이터 분석이 필수적이다. 본고에서는 온라인게임 분야에 존재하는 다양한 위협요소 중 하나인 게임봇 및 작업장 탐지에 적용된 데이터기반 보안 기술들에 대해 조사하고 향후 온라인게임분야에서의 데이터기반 보안의 연구 방향을 제시해 보고자 한다.

빅데이터 이용 확산을 위한 ODI 기반 데이터 액세스 프레임워크

  • 김화종
    • 정보와 통신
    • /
    • 제31권11호
    • /
    • pp.67-71
    • /
    • 2014
  • 최근 사회 각 분야에서 빅데이터를 분석하여 새로운 가치를 찾아내려는 시도가 급속히 증가하고 있다. 그러나 빅데이터를 분석하여 소기의 성과를 얻으려면 한 기관이나 기업이 자체로 보유하고 있는 데이터 뿐 아니라 외부에 있는 가치 있는 데이터가 필수적으로 필요한 경우가 대부분이다. 현재 빅데이터 이용에서 가장 어려운 것은 대용량 데이터를 다루는 하드웨어나 분석 소프트웨어 도입이 아니라 핵심적으로 필요한 외부 빅데이터를 어떻게 확보할 것인가이다. 본 고에서는 빅데이터를 효과적으로 공유하고 활용하기 위한 방안으로 오픈 데이터 인터페이스(ODI)를 제안한다. ODI를 사용함으로써 프로그램이 직접 읽을 수 있는(machine readable) 데이터 공유가 확대되고, 데이터 매쉬업이 쉬워지며, 개인의 데이터 가공 능력을 거래할 수 있는 생태계 구현이 가능해질 것이다.

Comparative Study on Advanced NSDIs for the Future NGIS Implementation in Korea

  • Kim Eun-Hyung
    • Spatial Information Research
    • /
    • 제13권4호
    • /
    • pp.381-391
    • /
    • 2005
  • 국가공간데이터기반 개념은 국가공간데이터기반의 발전과 더불어 변화한다. 초기의 국가공간데이터기반은 개별적이고 공간데이터기반 자체에 초점을 두었지만, 최근 국가공간데이터기반은 세계, 지역 및 지방공간데이터기반 간의 위계구조에서의 역할이 초점이 맞추어지고 있다. 본 논문에서는 최근의 국가공간데이터기반의 특성과 미국, 영국, 캐나다 국가공간데이터기반 등 각 국에 대한 비교, 분석을 통해 향후 우리나라의 차세대 국가공간데이터기반, 즉 국가GIS의 정책방향을 모색하도록 한다.

  • PDF

철자 기반과 음절 기반 속도가 한국인 영어 학습자의 발음 평가에 미치는 영향 비교 (Comparing the effects of letter-based and syllable-based speaking rates on the pronunciation assessment of Korean speakers of English)

  • 정현성
    • 말소리와 음성과학
    • /
    • 제15권4호
    • /
    • pp.1-10
    • /
    • 2023
  • 본 연구에서는 AI Hub에 구축된 '교육용 한국인의 영어 음성 데이터'에 있는 발음 평가 데이터를 활용하여 철자 기반 발화 속도 및 조음 속도와 음절 기반 발화 속도 및 조음 속도 중 발음 정확성 및 운율 유창성, 합산 점수를 예측하는 모델에 어떤 요소가 더 유의미한 영향을 미치는지 분석하였다. 이를 위해 13세, 19세, 26세 연령별, 성별, 수준별로 이 코퍼스의 훈련 데이터에서 총 900개 발화를 추출하여 데이터에 포함된 다양한 요소를 활용해 평가 점수를 예측하는 선형효과분석을 실행하였다. 선형효과분석에서 최적의 세 개 모델을 통해 예측된 평가 점수를 검증 데이터에서 추출한 총 180개 발화의 평가 점수와 얼마나 상관관계가 있는지도 분석하였다. 분석 결과 발음의 정확성과 운율의 유창성, 합산 점수 예측 모델 모두 철자 기반 발화 속도와 조음 속도보다 음절 기반 발화 속도와 조음 속도가 평가 점수를 예측하는데 더 큰 영향을 주는 것으로 밝혀졌다. 모델에서 예측한 점수와 검정 데이터의 실제 점수와의 상관계수는 .65에서 .68 사이로 각 모델의 평가 점수 예측력이 나쁘지 않았다. 발화 속도와 조음 속도 간에 어떤 요소가 더 큰 영향을 미치는지는 본 연구를 통해 밝혀내지 못하였다.

바이오 네트워크 구축을 위한 바이오인포매틱스 기반 기술 (Bioinformatics for constructing bio-pathways)

  • 박선희
    • 한국광학회:학술대회논문집
    • /
    • 한국광학회 2003년도 제14회 정기총회 및 03년 동계학술발표회
    • /
    • pp.124-125
    • /
    • 2003
  • 바이오인포매틱스 기술이란 정보통신 인프라와 IT기술을 기반으로 분산되어 있는 대용량의 바이오 데이터 및 문헌 정보를 통합적으로 관리, 분석 및 처리하여 각종 바이오 정보 활용 분야(신약개발, 의료진단, 농산물 개량 등)에 효율적으로 응용 서비스하기 위한 IT-BT융합 핵심 기반 요소 기술을 의미한다. 2000. 6. 인간 유전체 초안 완성 후 대량 획득되는 바이오 데이터의 최대 부가가치 창출을 위해 대용량 바이오 데이터로부터 유용한 지식정보를 자동적으로 추출해내기 위한 효율적인 통합분석 기술이 필요하고 이는 바이오인포매틱스 기본 개념이 된다. (중략)

  • PDF

웹로그 분석을 적용한 웹사이트내의 웹컨텐츠 분석 연구 결과 (Web log Data Analysis Apply to Web Contents Analysis Result data)

  • 정선경;이칠우
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (B)
    • /
    • pp.579-581
    • /
    • 2003
  • 본 논문은 웹사이트를 구성하는 웹컨텐츠의 합목적성 및 사용성 평가를 위하여 웹사이트 사용자들의 흔적인 웹로그 분석 데이터를 적용하여 정량적인 평가를 한 결과 에 대하여 보고 하고자 한다. 웹로그파일은 사용자가 웹사이트를 이용하면 이에 대한 기록이 로그라는 형태로 흔적이 남는다. 로그분석이란 이 데이터를 기반으로 위에서 말한 다양한 정보를 추출해 내는 것이라 할 수 있다. 로그분석은 사용자에 따라 단지 로그 정보를 분석하는 것에 한정시키기도, 로그 정보를 기반으로 한 보다 다양한 정보를 분석하는 확장된 개념으로 확대시키기도 한다. 본 논문은 웹트랜즈[로그분석 툴]를 사용하여 웹사이트내의 웹컨텐츠 분석에 웹 로그 분석 결과가 같는 정량적인 개념을 활용하여 정상적인 분석으로 일관되었던 웹사이트 분석에 새로운 결과를 도출하였다. 또한 마케팅을 수행하는 데 있어서 고객의 요구에 천저히 대응하기 위해서 고객을 철저히 파악하여야 한다. 로그파일 분석을 통해서 주요 고객층, 고객의 구매 패턴, 주 구매시간, 구매탐색 경로등의 데이터를 추출할 수 있다. 로그파일 분석 데이터를 기반으로 인터페이스 설계나 상품의 레이아웃등의 설계, 고객 서비스 강화등의 다양한 대 고객 마케팅을 펼칠 수 있다. 본 논문은 단순 수치해석의 개념이었던 로그 분석에 웹컨텐츠분석 기법을 접목하여 웹사이트내에서 사용되고 있는 컨텐츠의 사용성에 대안 연구 결과에 대해서 발표하고자 한다.

  • PDF

빅데이터를 활용한 홍수 후 유출변화 추정 (Estimating runoff changes after the flood using big data)

  • 선우우연;이재경;전경수
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2022년도 학술발표회
    • /
    • pp.297-297
    • /
    • 2022
  • 홍수 발생으로 인해 야기되는 피해가 매년 일어나고 있으며, 현재 수재와 관련된 방대한 데이터가 축적되어 있어 이를 활용한 연구들이 진행되고 있다. 데이터를 기반으로 홍수 전후의 시공간적인 변화에 대한 다양한 분석이 가능하여 수재 대응에 유용하게 활용될 수 있다. 본 연구에서는 원격 탐지 및 재분석 데이터를 활용하여 파머 가뭄 지수(PDSI), 강우량, 유출량, 실제 증발산량(AET), 대기 온도 등의 수재와 관련된 요인들에 대한 지수분석을 통해 공간 변화를 파악하고 경향을 분석하였다. 이를 통해 자연 현상을 다루는 환경 영역에서의 데이터 기반 연구의 가능성이 확대될 수 있으며, 향후 연구에 활용하고자 한다.

  • PDF