• 제목/요약/키워드: 빅데이터 기법

검색결과 790건 처리시간 0.028초

데이터마이닝을 통한 방위산업기술 분석 연구: 특허분석을 중심으로 (Study for Analyzing Defense Industry Technology using Datamining technique: Patent Analysis Approach)

  • 손창호
    • 한국산학기술학회논문지
    • /
    • 제19권10호
    • /
    • pp.101-107
    • /
    • 2018
  • 최근 우리나라의 방위산업은 고도의 발전을 해왔고 국방비 중에서 국방 R&D 예산도 점차적으로 증가하고 있다. 하지만 방위산업기술에 대한 객관적인 분석 없이는 효과적인 국방 R&D 활동이 제한적이고 자칫 국방예산이 비효율적으로 사용될 수 있다. 따라서 본 논문은 현재 주로 실시하고 있는 전문가들의 의견을 반영한 정성적인 방위산업기술의 분석에 더해서 정량적인 방법으로 방위산업기술을 객관적으로 분석함으로써 국방예산의 효율적 사용과 더 나아가서는 세계시장에서의 경쟁 우위를 달성하고자 하였다. 더구나 4차 산업혁명의 키워드 중의 하나인 빅데이터 분석 방법을 국방산업기술에 적용해서 객관적이고 체계적으로 국방산업기술의 특성과 공백기술을 파악하기 위한 특허분석 방법을 제안한다. 제안된 방법은 여러 국방산업기술 중에서 화력분야의 기술에 적용하여 사례분석을 수행하였다. 그 과정은 우선 방위산업진흥원의 방위 산업기업의 분류에서 화력에 관련된 10개 국내 기업의 특허를 Kipris를 통해서 수집하고 이 중에서 IPC 코드를 활용하기 위해서 이를 전처리하여 데이터 매트릭스를 구축하였다. 그리고 R 프로그램을 활용하여 데이터마이닝 기법 중에서 각 항목 간 연관성을 파악할 수 있는 연관규칙마이닝을 수행하였다. 이를 통해서 화력분야의 각 기술에 대한 지지도, 신뢰도, 향상도 값을 도출하고 이를 해석하여 결론을 제시하였다. 따라서 본 논문은 막대한 국방예산의 효율적인 사용과 국방산업기술의 경쟁력 제고에 도움을 줄 수 있을 것이라고 판단된다.

인공지능발달 토픽 프레임 연구 -계열화(seriation)와 통합화(skeumorph)의 사회구성주의 중심으로- (A Study on AI Evolution Trend based on Topic Frame Modeling)

  • 권상희;차현주
    • 한국콘텐츠학회논문지
    • /
    • 제20권7호
    • /
    • pp.66-85
    • /
    • 2020
  • 본 연구의 목적은 AI 기술 특허(전체)와 주요 신문에 나타난 AI 보도 프레임을 바탕으로 AI 발달과정 추세를 예측하고 이를 기술·설명하는 것이다. 이를 위해 지난 9년간 출원된 한국과 미국 기술특허 요약문과 국내 주요 신문의 AI(Artificial Intelligence) 뉴스 텍스트를 분석하였다. 본 연구는 빅데이터를 활용한 토픽모델링과 시계열회귀분석이 사용되었으며, 추가로 네트워크 의제 상관분석과 회귀분석 기법이 사용되었다. 본 연구결과는 다음과 같다. 첫째, Topic 모델링 분석결과, AI 기술특허 요약문에서는 인공지능, 알고리즘 5G(Hot AI 기술) 등의 순으로 확인되었으며, AI 뉴스보도에서는 산업 적용, 데이터 활용과 시장 적용 등의 순으로 확인되어 AI의 사회문화 보도 경향을 나타냈다. 둘째, 시계열회귀분석결과, 상승추세 토픽으로는 사회문화적으로 AI 일상적·문화적 이용과 산업적용 시작이 도출되었다. 하락추세토픽으로는 시스템, 하드웨어 기술 중심으로 나타났다. 셋째, 상관관계와 회귀관계를 활용한 QAP 분석 결과, AI 기술특허와 뉴스 보도 프레임 간의 상관관계는 높은 것으로 나타났다. 이를 통해 AI 발달에서 AI 기술특허와 뉴스 보도 프레임이 미디어 담론의 결정요인에 의해 사회적으로 구성되는 것을 알 수 있었다.

GWL을 적용한 공간 헤도닉 모델링 (Spatial Hedonic Modeling using Geographically Weighted LASSO Model)

  • 진찬우;이건학
    • 대한지리학회지
    • /
    • 제49권6호
    • /
    • pp.917-934
    • /
    • 2014
  • 지리가중회귀 모델(GWR)은 국지적으로 이질적인 부동산 가격을 추정할 수 있는 도구로 폭넓게 활용되어 왔다. 그럼에도 불구하고 GWR은 공간적으로 이질적인 가격결정요인의 선택이나 국지적 추정에서의 관측치 수의 제한 등과 같은 한계를 가지고 있다. 본 연구는 이러한 한계를 극복하기 위한 대안으로 최근 주목받고 있는 지리가중라소 모델(GWL)을 이용하여 국지적으로 다양한 부동산 가격결정요인들을 탐색하고, 부동산 가격 추정에 있어서 GWL 모델의 적용가능성을 살펴보고자 한다. 이를 위해 서울시 아파트 가격을 대상으로 OLS, GWR, GWL의 헤도닉 모델을 구축하였으며, 모델의 설명력, 예측력, 다중공선성 측면에서 이들을 비교 분석하였다. 그 결과, 전역적 모델에 비해 국지적 모델이 전체적인 설명력, 예측력이 우수한 것으로 나타났으며, 특히 국지적 모델 중 GWL 모델은 다중공선성 문제를 자동적으로 해결하면서 공간적으로 이질적인 가격 결정요인 집합들을 도출하였고, 다른 모델들에 비해 상당히 높은 설명력과 예측력을 보여주고 있다. 본 연구에서 적용한 GWL 모델은 고차원의 데이터셋에서 유의미한 독립 변수들을 효율적으로 선정하는데 직접적인 도움을 줌으로써 부동산과 같이 대용량의 복잡한 구조를 가진 공간 빅데이터를 위한 유용한 분석 기법으로 활용될 수 있을 것이다.

  • PDF

맞춤형 여행 콘텐츠 개발을 위한 OCR 기법을 활용한 영화 속 촬영지 정보 추출 방안 제시 (Study on Extracting Filming Location Information in Movies Using OCR for Developing Customized Travel Content)

  • 박은비;신유빈;강주영
    • 한국빅데이터학회지
    • /
    • 제5권1호
    • /
    • pp.29-39
    • /
    • 2020
  • 목적 사회 전반적으로 퍼진 개인의 취향에 대해 존중하는 분위기는 소비 트렌드를 바꾸었다. 그에 따라 여행 산업에서도 소비자 개인의 취향을 반영하는 맞춤형 여행이 새로운 트렌드로 주목받고 있다. 특히 여행 산업 분야 중 하나인 '영화 관광'에 대한 관심이 커지고 있음에 주목하였다. 영화를 시청하며 발생하는 개인의 여행 동기를 맞춤형 여행 제안으로 충족시키고자 하며, 이는 '영화 관광 산업'의 지속적 발전의 촉진제가 될 것으로 기대한다. 설계/방법론/접근 본 연구에서는 시청자가 실제로 방문하고 싶은 영화 속 촬영지 정보를 'OCR'을 통해 추출, 제안하는 방법론을 구현하였다. 먼저, 실시간 이미지 프로세싱 라이브러리인 'OpenCV'를 활용하여 사용자가 선택한 영화 속 장면을 추출 받는다. 또한, 딥러닝 기반의 텍스트 영역 탐지모델인 'EAST 모델'을 활용하여 해당 장면 이미지에서 문자가 위치한 곳을 탐지하여 검출한다. 검출한 이미지는 'OpenCV 내장 함수'를 사용해 전처리하여 인식의 정확도를 높인다. 마지막으로 광학 문자 인식 엔진인 'Tesseract'를 사용하여 이미지 속 문자를 인식 가능한 텍스트로 변환한 후, 'Google Map API'를 통해 실제 위치 정보를 반환한다. 의의 본 연구는 기존의 영화 관광에서 나아가, 4차 산업 기술을 활용한 개인 맞춤 관광 콘텐츠를 제공해준다는 점에서 큰 의의가 있다. 이는 앞으로 여행사와 함께 영화 관광 패키지 상품 개발에 활용될 수 있다. 또한 국내에서 해외로의 유입뿐만 아니라, 해외에서 국내로의 유입에 활용될 가능성 역시 내포하고 있다.

위치기반 서비스(Location-based Service)의 프라이버시 위험 대응에 있어 사용자 감정(Affect)의 역할 (An Investigation of a Role of Affective factors in Users' Coping with Privacy Risk from Location-based Services)

  • 박종화;정윤혁
    • 한국빅데이터학회지
    • /
    • 제5권2호
    • /
    • pp.201-213
    • /
    • 2020
  • 위험에 대한 인간의 반응은 인지적 요인뿐만 아니라 정서적 요인에도 유의미한 영향을 받는다는 경험적 연구에도 불구하고, 정보 프라이버시 연구에서는 감정적 요인의 역할이 제대로 규명되지 않고 있다. 본 연구는 정서적 관점에서 위치기반 서비스(Location-based service) 사용자의 프라이버시 위험에 대한 대응행위를 탐색하고자 한다. 구체적으로, 본 연구는 세 가지 유형의 개인정보 위협(수집, 해킹, 2차 사용), 두 가지 감정적 반응(걱정, 분노) 및 대응행위(지속적인 사용의도)의 관계를 탐색하였다. 이를 위해 위치기반서비스(Location-based service) 사용자 552 명에 대해 설문조사를 실시하였다. 특정 개인정보 위협에 대한 인식과 특정 감정적 반응의 결합이 지속적 사용의도에 미치는 영향을 분석하기 위해 데이터마이닝 기법 중 하나인 연관규칙(association rule)을 활용하여 분석을 진행하였다. 그 결과 위험에 대한 인식과 정서적 반응의 결합에 따라 사용의도에 차이가 나타났으며, 대체로 개인정보의 2차 사용에 대해 분노의 감정이 유발될 경우 사용의도가 가장 크게 감소하는 것으로 나타났다. 본 연구는 정보 프라이버시 사용자 연구에 감정적 요인을 포함함으로써, 기존의 인지적 접근방식 편향을 보완하고 프라이버시 대응행위에 대한 포괄적 이해를 제공한다는 점에서 학문적 의의가 있다.

서남해안 연안 해양기상 관측자료의 지속시간 특성 분석 (Persistence Analysis of Observed Metocean Data in the Southwest Coast in Korea)

  • 이기섭;서경식;조홍연
    • 한국해안·해양공학회논문집
    • /
    • 제34권6호
    • /
    • pp.303-314
    • /
    • 2022
  • 해양 물리 환경 인자의 지속시간 분석은 작업시간, 설계와 같은 해안공학적 관점에서 요구되는 분석으로 해역 이용에 필수로 선행되어야하는 기초 분석이다. 본 연구에서는 기상청 해양기상관측부이 중 우리나라 서남해안 4개 관측 지점(덕적도, 외연도, 거문도, 거제도)의 풍속 및 유의파고 자료의 지속시간 분석을 수행하였다. 기준풍속은 1~15 m/s, 기준유의파고는 0.25~3.0 m의 범위를 설정하고 관측자료가 이를 넘어서 지속되는 시간을 산정했다. 분석결과, 풍속과 유의파고의 지속시간은 기준값이 높아질수록 급격히 감소했으며, 최대 기준 조건에서 지속시간의 중간값은 풍속이 최대 5시간, 유의파고는 최대 8시간으로 계산되었다. 1% 미만의 확률로 발생하는 지속시간은 기준풍속이 15 m/s일 때 최대 52시간, 기준유의파고가 3m일 때 최대 56시간으로 나타났다. 향후 우리나라 전 해역을 대상으로 해양기상 자료의 지속시간 분석을 수행할 수 있으며, 다양한 공학적 활용이 기대된다.

딥러닝 기반 온라인 리뷰를 활용한 추천 모델 개발: 레스토랑 산업을 중심으로 (Developing a deep learning-based recommendation model using online reviews for predicting consumer preferences: Evidence from the restaurant industry)

  • 김동언;장동수;엄금철;이가은
    • 지능정보연구
    • /
    • 제29권4호
    • /
    • pp.31-49
    • /
    • 2023
  • 레스토랑 산업의 성장과 함께 레스토랑 오프라인 매장 수는 점차 증가하지만, 소비자는 자신의 선호도에 적합한 레스토랑을 선택하는 데 어려움을 경험하고 있다. 따라서 소비자의 선호도에 맞는 레스토랑을 추천하는 개인화된 추천 서비스의 필요성이 대두하고 있다. 기존 연구에서는 설문조사 및 평점 정보를 활용하여 소비자 선호도를 조사했으나, 이는 소비자의 구체적인 선호도를 효과적으로 반영하는데 어려움이 존재한다. 이러한 배경하에 온라인 리뷰는 방문 동기, 음식 평가 등 레스토랑에 대한 소비자 구체적인 선호도를 효과적으로 반영하기 때문에 필수적인 정보이다. 한편, 일부 연구에서는 리뷰 텍스트에 전통적인 기계학습 기법을 적용하여 소비자의 선호도를 측정하였다. 그러나 이러한 접근 방식은 주변 단어나 맥락을 고려하지 못하는 한계점이 존재한다. 따라서 본 연구는 딥러닝을 효과적으로 활용하여 온라인 리뷰에서 소비자의 선호도를 정교하게 추출하는 리뷰 텍스트 기반 레스토랑 추천 모델을 제안한다. 본 연구에서 제안된 모델은 추출된 높은 수준의 의미론적 표현과 소비자-레스토랑 상호작용을 연결하여 소비자의 선호도를 정확하고 효과적으로 예측한다. 실험 결과에 따르면 본 연구에서 제안된 추천 모델은 기존 연구에서 제안된 여러 모델에 비해 우수한 추천 성능을 보이는 것으로 나타났다.

인코더와 디코더에 기반한 합성곱 신경망과 순환 신경망의 새로운 하이브리드 접근법 (New Hybrid Approach of CNN and RNN based on Encoder and Decoder)

  • 우종우;김건우;최근호
    • 경영정보학연구
    • /
    • 제25권1호
    • /
    • pp.129-143
    • /
    • 2023
  • 빅데이터 시대를 맞이하여 인공지능 분야는 괄목할만한 성장을 보이고 있으며 특히 딥러닝에 의한 이미지 분류 학습방법이 중요한 영역으로 자리하고 있다. 이미지 분류에서 많이 사용되어 온 CNN의 성능을 더욱 개선하기 위해 다양한 연구가 활발하게 진행되었는데, 이 중에서 대표적인 방법이 CRNN(Convolutional Recurrent Neural Network) 알고리즘이다. CRNN 알고리즘은 이미지 분류를 위한 CNN과 시계열적 요소를 인식하기 위한 RNN의 조합으로 구성되는데, CRNN의 RNN영역에서 사용하는 입력값은 학습 대상의 이미지를 합성곱과 풀링 기법을 적용하여 추출된 결과물을 flatten한 값이고, 이 입력값들은 이미지 내 동일 위상에 있는 픽셀값들이 서로 다른 순서로 나타나기 때문에, RNN에서 의도한 이미지 내 배열 순서를 제대로 학습하기 어렵다는 한계점을 지닌다. 따라서 본 연구는 인코더와 디코더의 개념을 응용한 CNN과 RNN의 새로운 하이브리드 방법을 제안하여, 이미지 분류 성능을 향상시키는 것을 목적으로 하였다. 본 연구에서는 다양한 알고리즘 비교 실험을 통해, 새로운 하이브리드 방법의 효과성을 검증하였다. 본 연구는 인코더와 디코더 개념의 적용 가능성을 넓히고, 제안한 방법이 기존 하이브리드 방법에 비해, 복잡도가 크게 증가하지 않아 모델 학습 시간과 인프라 구축 비용 측면에서 이점을 있다는 점에서 학문적 시사점을 가진다. 또한, 정확한 이미지 분류가 필요한 다양한 분야에서 제공되는 서비스의 품질을 높일 수 있는 가능성을 제시하였다는 점에서 실무적 시사점을 가진다.

Landsat 8 영상을 이용한 심층신경망 기반의 지표면온도 산출 (Retrieval of Land Surface Temperature Using Landsat 8 Images with Deep Neural Networks)

  • 김서연;이수진;이양원
    • 대한원격탐사학회지
    • /
    • 제36권3호
    • /
    • pp.487-501
    • /
    • 2020
  • 이 연구에서는 고해상도 위성영상을 이용하여 지표면 온도를 산출하는 기존의 여러가지 방법 이외에 보다 새로운 접근으로, 인공지능 기반의 심층신경망 기법을 148장의 Landsat 8 영상에 적용하여 우리나라 지표면온도를 산출하고 그 적합성을 평가하였다. Landsat 8 열적외 10번 밴드(약 11 ㎛ 파장대)의 밝기온도와 방출률은 물리방정식에 경험상수가 결합하여 도출된 값이기 때문에, 지역적 기상, 기후, 지형, 식생 등의 조건에 따른 불확실성을 내포하고 있다. 이를 보완하기 위하여 본 연구에서는 밝기온도와 방출률로부터 지표면온도 초기추정치 T0를 산출하고 이와 함께, NDVI, 토지피복, 지형요소(고도, 경사, 향, 거칠기) 등을 입력변수로 하는 계절별 심층신경망 모델을 최적화하여 지표면온도를 산출하였다. 이는 ASOS(Automated Synoptic Observing System)와의 선형관계식으로 편의보정을 수행하는 기존 방법에 비해 진보된 기법이다. ASOS 관측치와 시공간적으로 일치되는 1,728건의 자료를 비교한 결과, 계절별로 차이가 있기는 하지만 특히 봄, 가을에는 상당히 좋은 결과를 보였으며(CC=0.910~0.917, RMSE=3.245~3.365℃), 또한 토지피복 유형에 상관없이 안정적인 산출이 이루어짐을 확인하였다. 향후 Landsat 5/7/8 자료의 장기시계열 빅데이터와 함께 추가적인 지표면변수를 활용하여 모델링 을 수행함으로써 기후변화 및 특이기상 하에서도 보다 신뢰도 높은 고해상도 지표면온도 산출이 필요할 것이다.

대규모 동적 O/D 생성을 위한 추정 방법론 연구: 첨두 출근통행을 기준으로 (A Methodology for Estimating Large Scale Dynamic O/D of Commuter Working Trip)

  • 한혁;홍기만;김태균;황준문;홍영석;조중래
    • 대한교통학회지
    • /
    • 제36권3호
    • /
    • pp.203-215
    • /
    • 2018
  • 본 연구는 통행자의 통행패턴이 도착지의 토지이용패턴에 따라 변화하는 특징을 반영하여 대규모 동적 O/D를 구축하는 방법을 제안하였다. 기존 동적 O/D 추정 방법 관련 연구들을 살펴보면 자료수집의 어려움으로 소규모 지역에 국한하여 적용 가능하거나, 고속도로망 혹은 대중교통망 등 특정 교통망에 제한하여 O/D를 구축하는 등 한계가 존재한다. 이에 본 연구에서는 빅데이터 시대에 발맞추어 쉽게 수집, 이용이 가능한 교통 관련 자료들을 기반으로 분석 지역의 범위 제약 없이 동적 O/D를 추정하는 기법을 제시하였다. 군집 분석(Clustering Analysis) 기법을 이용하여 군집별 도착시간 기준 통행분포 비율로 출발시간 통행분포 비율을 산정하고 첨두 출발시간 분포함수를 추정하였다. 추정된 분포함수를 조사자료에 적용하여 비교 검증을 진행해본 결과 통계적으로 유의하게 나타났다.