• 제목/요약/키워드: Dataset construction

검색결과 198건 처리시간 0.028초

Speech Emotion Recognition in People at High Risk of Dementia

  • Dongseon Kim;Bongwon Yi;Yugwon Won
    • 대한치매학회지
    • /
    • 제23권3호
    • /
    • pp.146-160
    • /
    • 2024
  • Background and Purpose: The emotions of people at various stages of dementia need to be effectively utilized for prevention, early intervention, and care planning. With technology available for understanding and addressing the emotional needs of people, this study aims to develop speech emotion recognition (SER) technology to classify emotions for people at high risk of dementia. Methods: Speech samples from people at high risk of dementia were categorized into distinct emotions via human auditory assessment, the outcomes of which were annotated for guided deep-learning method. The architecture incorporated convolutional neural network, long short-term memory, attention layers, and Wav2Vec2, a novel feature extractor to develop automated speech-emotion recognition. Results: Twenty-seven kinds of Emotions were found in the speech of the participants. These emotions were grouped into 6 detailed emotions: happiness, interest, sadness, frustration, anger, and neutrality, and further into 3 basic emotions: positive, negative, and neutral. To improve algorithmic performance, multiple learning approaches were applied using different data sources-voice and text-and varying the number of emotions. Ultimately, a 2-stage algorithm-initial text-based classification followed by voice-based analysis-achieved the highest accuracy, reaching 70%. Conclusions: The diverse emotions identified in this study were attributed to the characteristics of the participants and the method of data collection. The speech of people at high risk of dementia to companion robots also explains the relatively low performance of the SER algorithm. Accordingly, this study suggests the systematic and comprehensive construction of a dataset from people with dementia.

Predicting tensile strength of reinforced concrete composited with geopolymer using several machine learning algorithms

  • Ibrahim Albaijan;Hanan Samadi;Arsalan Mahmoodzadeh;Danial Fakhri;Mehdi Hosseinzadeh;Nejib Ghazouani;Khaled Mohamed Elhadi
    • Steel and Composite Structures
    • /
    • 제52권3호
    • /
    • pp.293-312
    • /
    • 2024
  • Researchers are actively investigating the potential for utilizing alternative materials in construction to tackle the environmental and economic challenges linked to traditional concrete-based materials. Nevertheless, conventional laboratory methods for testing the mechanical properties of concrete are both costly and time-consuming. The limitations of traditional models in predicting the tensile strength of concrete composited with geopolymer have created a demand for more advanced models. Fortunately, the increasing availability of data has facilitated the use of machine learning methods, which offer powerful and cost-effective models. This paper aims to explore the potential of several machine learning methods in predicting the tensile strength of geopolymer concrete under different curing conditions. The study utilizes a dataset of 221 tensile strength test results for geopolymer concrete with varying mix ratios and curing conditions. The effectiveness of the machine learning models is evaluated using additional unseen datasets. Based on the values of loss functions and evaluation metrics, the results indicate that most models have the potential to estimate the tensile strength of geopolymer concrete satisfactorily. However, the Takagi Sugeno fuzzy model (TSF) and gene expression programming (GEP) models demonstrate the highest robustness. Both the laboratory tests and machine learning outcomes indicate that geopolymer concrete composed of 50% fly ash and 40% ground granulated blast slag, mixed with 10 mol of NaOH, and cured in an oven at 190°F for 28 days has superior tensile strength.

개념계층구조를 기반으로 하는 다치 삼원 데이터집합의 지식 추출 (Knowledge Mining from Many-valued Triadic Dataset based on Concept Hierarchy)

  • 황석형;정영애;황세웅
    • Journal of Platform Technology
    • /
    • 제12권3호
    • /
    • pp.3-15
    • /
    • 2024
  • 지식 마이닝은 다종다양한 대량의 데이터로부터 데이터 모델링, 정보추출 및 분석, 가시화, 결과 해석 등과 같은 다양한 기법들을 적용하여 데이터로부터 유용하고 가치 있는 지식을 찾아내는 연구 분야로서, 비즈니스, 의료, 과학 연구 등 다양한 영역에서 원시 데이터를 유용한 지식으로 변환하기 위한 중요한 역할을 수행한다. 본 논문에서는 형식개념분석기법을 확장하여 다종다양한 데이터로부터 지식발견과 데이터 마이닝을 수행하기 위한 분석기법을 제안한다. 분석대상 데이터의 다양한 형식과 구조를 표현하기 위한 제반 모델들(다치데이터 테이블, 삼원데이터테이블)과 데이터처리(이진화 및 평탄화) 및 개념계층구조 구축과 연관규칙 추출을 위한 알고리즘들을 정의하고, 공공오픈데이터를 대상으로 본 논문에서 제안한 기법을 적용한 실험을 수행하여 제안 기법의 유용성을 실증하였다.

  • PDF

데이터베이스 구축을 통한 산사태 위험도 예측식 개발 (Development of Landslide-Risk Prediction Model thorough Database Construction)

  • 이승우;김기홍;윤찬영;유한중;홍성재
    • 한국지반공학회논문집
    • /
    • 제28권4호
    • /
    • pp.23-33
    • /
    • 2012
  • 최근 들어 집중호우 및 태풍과 국지성 집중호우로 인한 산사태 피해가 자주 보고되고 있다. 국내 지형특성상 산지 인근에서 도시가 발달되고 도로 철도 등의 기간시설물이 건설된 경우가 많기 때문에 산사태로 인한 인명 및 재산피해는 매우 심각하다. 이러한 피해를 효과적으로 방지하기 위해서는 건설계획 단계부터 산사태 위험이 높은 지역을 파악하고 적절한 대책을 마련하는 것이 중요하다. 본 연구에서는 산사태 발생에 영향을 미칠 수 있는 지형학적 특성, 토질의 특성, 강우 정보, 나무의 종류 정보 등의 자료를 재해대장 분석, 항공사진 분석, 현장조사를 실시하여 구축한 423 지점의 산사태 데이터에 대한 통계학적 분석을 수행하여 산사태 위험도 예측식을 제안하였다. 제안된 예측식으로 예측된 결과와 실제 산사태 발생여부를 비교해 본 결과 약 92%의 분류 정확도를 보였다. 예측식에 필요한 입력치들은 단 시간 내에 저비용으로 획득할 수 있도록 구성하였다. 또한 예측결과의 경우 재해지도 형식으로 표현하기 용이하기 때문에 제안된 산사태 위험도 예측식은 광범위한 지역의 산사태 발생 위험도를 산정하는데 효과적으로 활용될 수 있다고 판단된다.

준공 BIM 구축을 위한 Graph-based SLAM 기반의 실내공간 3차원 지도화 연구 (A Study on 3D Indoor mapping for as-built BIM creation by using Graph-based SLAM)

  • 정재훈;윤상현;;허준
    • 한국건설관리학회논문집
    • /
    • 제17권3호
    • /
    • pp.32-42
    • /
    • 2016
  • 현재 국내 대부분의 토목 건축 구조물이 BIM 정보가 부재한 상황에서 준공 BIM(as-built BIM)의 수요가 점차 증가하고 있다. 준공 BIM 구축을 위한 공간자료 취득에는 고밀도의 포인트 클라우드를 생성할 수 있는 레이저 스캐너가 주로 활용되고 있다. 하지만 기존의 고정식 스캔 시스템은 이동이 번거롭고, 정밀한 위치 선정이 필요 하며, 스캔 자료 정합을 위해 별도의 표지를 설치하거나 공액점을 추출하는 과정이 필요하다. 본 연구에서는 수작업을 최소화하기 위해 기존의 고정식 스캔 시스템을 대체할 수 있는 이동식 스캔 시스템을 제안하고자 하며, 기반 기술로 graph-based SLAM을 적용하였다. 테스트 장비는 총 세 개의 2차원 스캐너를 탑재하고 있으며, 중앙의 한 개는 수평으로 설치되어 graph 구축을 통한 이동경로취득에 사용되었고, 좌우 두 개는 수직으로 설치되어 시스템 진행의 연직 방향으로 주변 구조물에 대한 3차원 스캔 정보 취득에 사용되었다. 개발된 graph-based SLAM은 이동경로 상에 누적된 위치오차를 해소하기 위한 loop closure 처리 방법으로 Adaboost 기계학습을 적용하였다. 이는 특히 본 연구에서 사용한 장비와 같이 기계학습을 위한 다수의 feature 정보를 제공할 수 있는 멀티 스캐너 시스템에 적합한 방식이며, 두 실내공간을 대상으로 한 테스트에서 단일 스캐너 대비 false positive rate를 각각 7.9% 및 13.6%까지 줄일 수 있었다. 최종적으로 연구대상지역의 2차원 및 3차원 지도 구축을 통해 개발된 graph-based SLAM의 효용성을 확인하였다.

머신러닝 기법과 TBM 시공정보를 활용한 토압식 쉴드TBM 굴진율 예측 연구 (A Study on Prediction of EPB shield TBM Advance Rate using Machine Learning Technique and TBM Construction Information)

  • 강태호;최순욱;이철호;장수호
    • 터널과지하공간
    • /
    • 제30권6호
    • /
    • pp.540-550
    • /
    • 2020
  • 최근 AI 기술의 발전과 정립으로 자동화 분야에서 머신러닝 기법의 활용이 활발하게 이루어지고 있다. 머신러닝 기법의 활용에 있어 중요한 점은 데이터 특성에 따라 적합한 알고리즘이 존재한다는 점이며, 머신러닝 기법 적용을 위한 데이터세트의 분석이 필요하다. 본 연구에서는 다양한 머신러닝 기법을 기반으로 하천 하부의 토사지반을 통과하는 토압식 쉴드TBM 터널 구간의 지반정보와 굴진정보를 사용하여 토압식 쉴드TBM의 굴진율을 예측하였다. 선형회귀모델에서 모델의 통계적인 유의성과 다중공선성에서는 문제가 없었으나 결정계수가 0.76으로 나타났고 앙상블 모델과 서포트 벡터 머신에서는 0.88이상의 예측성능을 보여, 분석한 데이터세트에서 토압식 쉴드TBM 굴진성능예측에 적합한 모델은 서포트 벡터 머신임을 알 수 있었다. 현재 도출된 결과로 볼 때, 토압식 쉴드TBM의 기계데이터와 지반정보가 포함된 데이터를 활용한 굴진성능 예측 모델의 적합성은 높다고 판단된다. 추가적으로 지반조건의 다양성과 데이터양을 늘리는 연구가 필요한 것으로 판단된다.

농업용 저수지 CCTV 영상자료 기반 수위 인식 모델 적용성 검토 (A study on the application of the agricultural reservoir water level recognition model using CCTV image data)

  • 권순호;하창용;이승엽
    • 한국수자원학회논문집
    • /
    • 제56권4호
    • /
    • pp.245-259
    • /
    • 2023
  • 농업용 저수지는 농업용수 공급에 있어서 매우 중요한 생산기반시설로, 우리나라 농업용수의 60% 정도를 공급하고 있다. 다만, 여러 문제로 인해 농업용수의 효율적인 공급에 어려움이 발생하고 있으며, 효과적인 공급 및 관리 체계 구현을 위한 정확한 실시간 저수위 혹은 저수량 추정이 필요하다. 본 연구에서는 영상정보를 활용한 딥러닝 기반 농업용 저수지 수위 인식 모델을 제안하였다. 개발한 모델은 (1) CCTV 영상정보 자료 수집 및 분석, (2) U-Net 이미지 분할 방법을 통한 입력 자료 생성, 그리고 (3) CNN과 ResNet 모델을 통한 수위 인식 세 단계로 구성된다. 모델은 두 농업용 저수지(G저수지와 M저수지)의 영상자료와 저수위 시계열자료를 활용하여 구현하였다. 적용 결과 이미지 분할 모델의 성능은 매우 우수한 것으로 나타났으며, 수위 인식 모델의 경우 수위 분류 계급구간에 따라 성능이 상이한 것으로 나타났다. 특히 영상자료의 픽셀 변동이 클수록 정확도 80% 이상이 확보 가능한 것으로 확인되었으나, 그렇지 않은 경우, 정확도가 50% 수준인 것으로 나타났다. 본 연구에서 개발한 모델은 향후 이미지 자료가 추가로 확보될 경우, 그 활용도 및 정확도가 더 높아질 것으로 기대한다.

인터넷 검색기록 분석을 통한 쇼핑의도 포함 키워드 자동 추출 기법 (A Methodology for Extracting Shopping-Related Keywords by Analyzing Internet Navigation Patterns)

  • 김민규;김남규;정인환
    • 지능정보연구
    • /
    • 제20권2호
    • /
    • pp.123-136
    • /
    • 2014
  • 최근 온라인 및 다양한 스마트 기기의 사용이 확산됨에 따라 온라인을 통한 쇼핑구매가 더욱 활성화 되었다. 때문에 인터넷 쇼핑몰들은 쇼핑에 관심이 있는 잠재 고객들에게 한 번이라도 더 자사의 링크를 노출시키기 위해 키워드에 비용을 지불할 용의가 있으며, 이러한 추세는 검색 광고 시장의 광고비를 증가시키는 원인을 제공하였다. 이 때 키워드의 가치는 대체로 검색어의 빈도수에 기반을 두어 산정된다. 하지만 포털 사이트에서 검색어로 자주 입력되는 모든 단어가 쇼핑과 관련이 있는 것은 아니며, 이들 키워드 중에는 빈도수는 높지만 쇼핑몰 관점에서는 별로 수익과 관련이 없는 키워드도 다수 존재한다. 그렇기 때문에 특정 키워드가 사용자들에게 많이 노출된다고 해서, 이를 통해 구매가 이루어질 것을 기대하여 해당 키워드에 많은 광고비를 지급하는 것은 매우 비효율적인 방식이다. 따라서 포털 사이트의 빈발 검색어 중 쇼핑몰 관점에서 중요한 키워드를 추출하는 작업이 별도로 요구되며, 이 과정을 빠르고 효과적으로 수행하기 위한 자동화 방법론에 대한 수요가 증가하고 있다. 본 연구에서는 이러한 수요에 부응하기 위해 포털 사이트에 입력된 키워드 중 쇼핑의도를 포함하고 있을 가능성이 높을 것으로 추정되는 키워드만을 자동으로 추출하는 방안을 제시하고, 구체적으로는 전체 검색어 중 검색결과 페이지에서 쇼핑과 관련 된 페이지로 이동한 검색어만을 추출하여 순위를 집계하고, 이 순위를 전체 검색 키워드의 순위와 비교하였다. 국내 최대의 검색 포털인 'N'사에서 이루어진 검색 약 390만 건에 대한 실험결과, 제안 방법론에 의해 추천된 쇼핑의도 포함 키워드가 단순 빈도수 기반의 키워드에 비해 정확도, 재현율, F-Score의 모든 측면에서 상대적으로 우수한 성능을 보이는 것으로 나타남을 확인할 수 있었다.

다기관 임상연구를 위한 인공지능 학습 플랫폼 구축 (Construction of Artificial Intelligence Training Platform for Multi-Center Clinical Research)

  • 이충섭;김지언;노시형;김태훈;윤권하;정창원
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제9권10호
    • /
    • pp.239-246
    • /
    • 2020
  • 인공지능 기술을 도입한 의료분야에서 진단 및 예측과 연계한 임상의사결정지원 시스템(CDSS)에 관련된 연구가 활발하게 진행되고 있다. 특히, 인공지능 기술 적용에 가장 많은 이슈를 일으키고 있는 의료영상기반의 질환진단연구가 다양한 제품으로 출시되고 있는 실정이다. 그러나 의료영상 데이터는 일관되지 않은 데이터들로 이루어져 있으며, 그것을 정제하여 연구에 사용하기 위해서는 상당한 시간이 필요한 것이 현실이다. 본 논문은 의료영상 표준인 R_CDM(Radiology Common Data Model)으로 변환하고, 그 데이터를 기반으로 인공지능 알고리즘 개발 연구를 지원하기위한 원스톱 인공지능학습 플랫폼에 대하여 기술한다. 이를 위해 기존 공통데이터모델(CDM : Common Data Model)과 연계에 중점을 두어 DICOM(Digital Imaging and Communications in Medicine) 태그정보를 기반으로 의료영상 표준 모델의 스키마와 다기관 연구를 위한 Report 정보를 포함하여 시스템을 모델링하였다. 이렇게 변환된 데이터 집합을 기반으로 인공지능 학습 플랫폼에서 수행 과정을 결과로 보인다. 제안한 플랫폼을 통해 다양한 영상기반 인공지능 연구에 활용될 것으로 기대하고 있다.

지리정보시스템을 이용한 새만금 해양환경정보시스템 구축 (Implementation of Saemangeum Coastal Environmental Information System Using GIS)

  • 김진아;김창식;박진아
    • 한국지리정보학회지
    • /
    • 제14권4호
    • /
    • pp.128-136
    • /
    • 2011
  • 새만금 방조제 건설 및 토지 개발사업에 따른 해양환경변화 모니터링 및 예측을 위하여 2002년부터 실시간 또는 정기 해양관측 및 수치모델 시뮬레이션을 수행하고 있다. 새만금 해양환경자료는 크게 해양기상, 해양물리/해수유동, 해양수질, 해양생태계, 해저 지형/지질 분야로 분류되며, 각 분야별 관측 및 예측을 통해 지속적으로 생산되는 자료는 10여년에 걸쳐 축적되고 있다. 수집된 해양환경자료는 대용량의 다차원 다변수 시 공간적 분포 특성을 갖는 이질적 자료이기 때문에 이러한 특성을 고려하여 효과적으로 자료의 수집 처리 관리 제공이 가능한 정보시스템 개발은 필수적이다. 이에 본 논문에서는 지리정보시스템과 연계된 웹 기반 새만금 해양환경정보시스템 구축을 통하여 분야별로 축적된 새만금 해양환경정보를 통합적으로 수집 관리하며, 직관적이고 효율적인 웹 사용자 인터페이스 구성과 statistical graphs 및 thematic cartography를 적용한 자료의 과학적 가시화를 통해 방대하고 복잡한 자료의 효과적인 조회 및 분석이 가능하다. 나아가 지오프로세싱을 통한 공간분석을 통해 장기간에 걸친 변화 양상에 대한 정량적 분석을 통하여 새만금의 친환경적 개발을 위한 과학적 근거 제시 및 의사결정 지원을 위한 도구로 활용되고 있다. 또한 원활한 웹 기반 정보 서비스를 위해 다중 맵 캐쉬, 다중 레이어, 공간 데이터베이스 구축 등도 병행되었다.