• 제목/요약/키워드: 데이터 산업

검색결과 5,362건 처리시간 0.038초

재처리시설주변의 환경안전기술 고도화

  • 한국원자력산업회의
    • 원자력산업
    • /
    • 제7권9호통권55호
    • /
    • pp.66-70
    • /
    • 1987
  • 방사선량이 선량한도 이내인가를 확인하는 모니터링을 위한 앞으로의 과제는 임의의 데이터 처리기능 등 데이터관리의 고도화에 있다. 일본 동경사업소의 연구는 현행모니터링의 보충조사와 고도화, 대형재처리시설의 안전평가 방법 확립에 노력하고 있다.

  • PDF

해외 동향 - 데이터 중심적 형상 관리

  • 한국원자력산업회의
    • 원자력산업
    • /
    • 제35권4호
    • /
    • pp.65-70
    • /
    • 2015
  • 통합된 형상 관리 정보 시스템은 원전의 허가에서부터 설계, 조달, 건설, 시험 가동, 운영, 유지보수와 원자로의 폐기까지 원전 수명의 전 과정을 아우르는 모든 데이터와 정보들을 총괄하여 관리하는 것이다. 최신 형상 정보 관리 시스템을 도입하면 원전 수명의 전 단계에 걸쳐 운영상의 이점과 경제적인 수익을 기대할 수 있다.

  • PDF

CNN 기반의 준지도학습을 활용한 GPR 이미지 분류 (A Study on GPR Image Classification by Semi-supervised Learning with CNN)

  • 김혜미;배혜림
    • 한국빅데이터학회지
    • /
    • 제6권1호
    • /
    • pp.197-206
    • /
    • 2021
  • GPR(Ground Penetrating Radar)에서 수집된 데이터는 지하 탐사를 위해 사용된다. 이 때, 지반 아래의 시설물들이 GPR을 반사하는 경우가 종종 발생하여 수집된 데이터는 전문가에 경험에 의존하여 해석된다. 또한, GPR 데이터는 수집 장비, 환경 등에 따라 데이터의 노이즈, 특성 등이 다르게 나타난다. 이로 인해 정확한 레이블을 가지는 데이터가 충분히 확보되지 못하는 경우가 많다. 일반적으로 이미지 분류 문제에서 높은 성능을 보이는 인공신경망 모델을 적용하기 위해서는 많은 양의 학습 데이터가 확보되어야 한다. 그러나 GPR 데이터의 특성 상 데이터에 정확한 레이블을 붙이는 것은 많은 비용을 필요로 하여 충분한 데이터를 확보하기가 어렵다. 이는 결국 일반적으로 활용되는 지도학습 방법을 기반으로 인공신경망을 적절히 학습시킬 수 없게 한다. 본 논문에서는 각 레이블의 정확도가 유사한 수준을 갖도록 하는 것을 목표로 데이터 특성을 바탕으로 하는 이미지 분류 방법을 제안한다. 제안 방법은 준지도학습을 기반으로 하고 있으며, 인공신경망으로부터 이미지의 특징값을 추출한 후 클러스터링 기법을 활용하여 이미지를 분류한다. 이 방법은 라벨링 된 데이터가 충분하지 않은 경우 라벨링할 때 뿐 만 아니라 데이터에 달린 레이블의 신뢰도가 높지 않은 경우에도 활용할 수 있다.

빅데이터 환경에서 개인정보 비식별화에 대한 위험성 제기 및 대응 방안 제시 (Raising Risk and Suggesting Solution about Personal Information De-identification in Big-Data Environment)

  • 이수림;장웅태;배재영;신찬호;현범수
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2016년도 추계학술발표대회
    • /
    • pp.297-300
    • /
    • 2016
  • 최근 빅데이터 산업이 발전하고 있는 상황에서 빅데이터 산업에 활용되는 개인정보의 보호에 관한 문제가 대두하고 있다. 빅데이터 산업에서 개인정보를 활용하기 위해서는 비식별화 조치를 해야 한다. 하지만 비식별화는 비식별화 평가 모델 자체의 취약성과 더불어 비식별화된 개인정보를 재식별화 하는 위험성도 존재한다. 본 논문은 적정성 평가 모델, 비식별화 조치 기술, 재식별에 관한 위험성을 연구하고 각 위험성에 대한 대응 방안을 통해 재식별화의 문제를 해결하여 빅데이터 산업에서 비식별화된 개인정보가 안전히 쓰일 수 있도록 해야 한다.

머신러닝을 이용한 교통사고 사상자 수 예측:서울시 공공데이터를 대상으로 (Prediction Of Traffic Accident Casualties Using Machine Learning: For Seoul Public Data)

  • 남명우;박두서;장영준;이홍철
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제63차 동계학술대회논문집 29권1호
    • /
    • pp.27-30
    • /
    • 2021
  • 경제 성장과 함께 자동차의 수요가 늘어남에 따라 교통사고 발생 빈도는 꾸준히 증가하고 있다. 이에, 본 연구에서는 교통사고를 야기하는 도로 및 기상환경과 같은 조건을 활용하여 기계학습 모델을 통해 서울시 교통사고 사상자 수를 예측하는 모형을 찾고자 한다. 활용한 데이터는 도로교통 공단에서 제공하는 교통사고 사상자 수 정보를 포함하는 데이터로 2015년부터 2018년도까지 데이터를 학습에 사용하였고 2019년도 데이터를 테스트 평가에 사용하였다. 실증연구를 통해 트리 기반의 모델 별 성능을 비교하였으며 본 연구에 대한 결과는 사고 발생 시 우선순위에 의한 구조활동이 가능하게 함과 도로상황 및 기상을 고려한 안전운전 가이드 지식으로 활용될 수 있다.

  • PDF

Class Activation Map을 활용한 전력 설비 패턴의 주요원인 분석 (Electrical equipment pattern analysis using Class Activation Map)

  • 장영준;김지호;최영진;이홍철
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제64차 하계학술대회논문집 29권2호
    • /
    • pp.75-77
    • /
    • 2021
  • 전력 생산의 효율을 높이고 지속적인 공정관리를 위해 전력 설비 데이터의 패턴을 분석하고 원인이 되는 주요 변수를 찾는 것이 중요하다. 따라서, 본 연구에서는 전력 설비 데이터의 패턴을 분석하기 위해 데이터를 군집화하고 연구 방법으로 Decision Tree, Random Forest와 ResNet을 이용하여 패턴을 분류하였다. Class Activation Map을 이용하여 설비데이터의 원인이 되는 주요 변수를 확인하였다. 본 연구를 통해 전력 설비 데이터의 분류 및 원인 분석이 가능한 통합적 솔루션을 제시하고자 한다.

  • PDF

산업재해 관리 시스템 구축을 위한 데이터 웨어하우스 마이닝 기법의 활용

  • 한정훈;유훈;이원근;심종칠;김창은
    • 한국산업안전학회:학술대회논문집
    • /
    • 한국안전학회 1998년도 추계 학술논문발표회 논문집
    • /
    • pp.225-230
    • /
    • 1998
  • 데이터 마이닝은 대용량 데이터베이스의 데이터 사이에 묻혀 있는 '패턴'을 발견하여 규칙을 추론함으로 여러 가지 유용한 지식을 캐내는 기법이다. 본 논문에서는 효과적인 재해관리 시스템을 구축하기 위해서 재해를 분석하고 대책을 마련할 수 있는 데이터 마이닝을 적용한 '데이터베이스 웨어하우스 마이닝 재해관리 데이터베이스 시스템'을 제시하고자 한다. 데이터 웨어하우스 마이닝은 다차원 데이터베이스로 구축되며 재해데이터간의 상호관련성, 특성요인별 패턴을 찾고 재해발생 가능성을 예측함으로써 재해예방의 의사결정을 지원할 수 있다.

  • PDF

데이터 클러스터링 기법을 이용한 퍼지 질의 처리

  • 김태희;김선경
    • 한국산업정보학회:학술대회논문집
    • /
    • 한국산업정보학회 1997년도 춘계학술대회 발표논문집
    • /
    • pp.129-139
    • /
    • 1997
  • 다양한 실세계의 표현은 주관적인 의미가 내포되어 있어 데이터의 모델링 과정이 보다 중요하며 이 과정에서 데이터 손실을 최소화시켜야 한다. 이러한 성향의 모든 데이터를 수용하기위한 퍼지데이터베이스 시스템 구축시에는 데이터가 퍼지 집합으로 표현되어야 하고 불확실하고 다양한 형태의 질의가 가능하며 신뢰성 있는 응답 제시되어야 한다. 본 논문에서는 불활실함의 의미를 최대한 반영하여 표현을 다양화 시키고 사용자의 주관적인 인식수용을 위한 데이터의 개별화와 레벨의 다양화를 위한 클러스터링(clustering)기법을 보인다. 이를 통해 영역구조를 병합 분리시켜 데이터베이스의 릴레이션에서의 도메인요소의 첨가와 삭제를 통하여 자유로운 질의에 대한 불확실성이 감소된 응답과 융통성이 부여된 퍼지질의 처리를 보여준다.

빅데이터 기반 의료 임상 결과 분석 (Big Data-based Medical Clinical Results Analysis)

  • 황승연;박지훈;윤하영;곽광진;박정민;김정준
    • 한국인터넷방송통신학회논문지
    • /
    • 제19권1호
    • /
    • pp.187-195
    • /
    • 2019
  • 최근 빅데이터 관련 기술들이 발전함에 따라 다양한 분야에서 생성되는 데이터들을 수집하여 저장하고 처리 및 분석할 수 있게 되었다. 이러한 빅데이터 기술들을 임상 결과 분석에 활용하고, 임상시험 설계 최적화를 통해 보건의료분야에 투입되는 막대한 비용을 절감할 수 있을 것으로 전망된다. 따라서 본 논문에서는 임상 결과를 분석하여 임상시험 기간과 비용 등을 줄일 수 있는 가이드 정보를 제시하고자 한다. 먼저 Sqoop을 사용하여 임상 결과 데이터가 저장된 관계형 데이터 베이스로부터 HDFS에 수집하여 저장하고, 하둡을 기반으로 동작하는 처리 도구인 Hive를 이용하여 데이터를 처리한다. 공공분야, 기업 등 각 분야에서 많이 활용되고 있는 빅데이터 분석 도구인 R을 이용하여 연관성 분석을 한다.

대리운전 시장의 지역별 수요 예측 모형의 성능 향상을 위한 방법론 연구 (A Study on Methodology for Improving Demand Forecasting Models in the Designated Driver Service Market)

  • 김민섭;박기군;허재현;권재은;배혜림
    • 한국빅데이터학회지
    • /
    • 제8권1호
    • /
    • pp.23-34
    • /
    • 2023
  • 대리운전 시장의 요금체계는 이용자의 대리운전 서비스 요청 시, 주위 대리운전 기사의 수, 대리운전 서비스 이용자 수, 날씨 등의 다양한 영향에 의해 실시간으로 변하는 Dynamic Pricing의 특징이 있다. 불확실한 변동성은 대리운전 서비스 요금을 상승시켜 고객의 이탈과 대리운전 기사의 배차거부를 유발하는 주된 원인이 되며, 이러한 문제를 해결하기 위해 적절한 수요를 예측하고 선제적으로 대응하기 위한 수요 예측모형의 도입이 요구된다. 본 연구에서는 대리운전 서비스 이력 데이터를 활용하여 지역별, 시간대별 대리운전 서비스 수요를 예측하는 모형을 제시한다. 이후 실제 대리운전 서비스 이력 데이터를 활용하여 시간과 요일에 따른 조건부 확률을 구축하고 이를 예측 모형과 결합한 Time-Series with Conditional Probability 방법론을 제안하였으며 실험을 통해 SARIMA, Prophet의 기존 시계열 모형보다 성능이 우수함을 검증하였다. 본 연구는 제안된 방법론을 통해 구축된 수요 예측 모형을 활용하여 대리운전 서비스의 단기 전략 수립에 활용할 수 있다는 시사점이 있다.