• 제목/요약/키워드: Analysis of Unstructured Data

검색결과 428건 처리시간 0.029초

비정렬 격자 기반의 결빙 액적 해석을 위한 유한체적 기법 (A THREE-DIMENSIONAL UNSTRUCTURED FINITE VOLUME METHOD FOR ANALYSIS OF DROPLET IMPINGEMENT IN ICING)

  • 정기영;정성기;명노신
    • 한국전산유체공학회지
    • /
    • 제18권2호
    • /
    • pp.41-48
    • /
    • 2013
  • Ice accretion on the solid surface is an importance factor in assessing the performance of aircraft and wind turbine blade. Changes in the external shape due to ice accretion can greatly deteriorate the aerodynamic performance. In this study, a three-dimensional upwind-type second-order positivity-preserving finite volume CFD scheme based on the unstructured mesh topology is developed to simulate two-phase flow in atmospheric icing condition. The code is then validated by comparing with NASA IRT experimental data on the sphere. The present results of the collection efficiency are found to be in close agreement with experimental data and show improvement near the stagnation region.

A Study on the General Public's Perceptions of Dental Fear Using Unstructured Big Data

  • Han-A Cho;Bo-Young Park
    • 치위생과학회지
    • /
    • 제23권4호
    • /
    • pp.255-263
    • /
    • 2023
  • Background: This study used text mining techniques to determine public perceptions of dental fear, extracted keywords related to dental fear, identified the connection between the keywords, and categorized and visualized perceptions related to dental fear. Methods: Keywords in texts posted on Internet portal sites (NAVER and Google) between 1 January, 2000, and 31 December, 2022, were collected. The four stages of analysis were used to explore the keywords: frequency analysis, term frequency-inverse document frequency (TF-IDF), centrality analysis and co-occurrence analysis, and convergent correlations. Results: In the top ten keywords based on frequency analysis, the most frequently used keyword was 'treatment,' followed by 'fear,' 'dental implant,' 'conscious sedation,' 'pain,' 'dental fear,' 'comfort,' 'taking medication,' 'experience,' and 'tooth.' In the TF-IDF analysis, the top three keywords were dental implant, conscious sedation, and dental fear. The co-occurrence analysis was used to explore keywords that appear together and showed that 'fear and treatment' and 'treatment and pain' appeared the most frequently. Conclusion: Texts collected via unstructured big data were analyzed to identify general perceptions related to dental fear, and this study is valuable as a source data for understanding public perceptions of dental fear by grouping associated keywords. The results of this study will be helpful to understand dental fear and used as factors affecting oral health in the future.

항공안전 보고 데이터 텍스트 분석 기반 조성을 위한 비식별 처리 기술 적용 연구 (A Study on De-Identification Methods to Create a Basis for Safety Report Text Mining Analysis)

  • 황도빈;김영곤;심영민
    • 한국항공운항학회지
    • /
    • 제29권4호
    • /
    • pp.160-165
    • /
    • 2021
  • In order to identify and analyze potential aviation safety hazards, analysis of aviation safety report data must be preceded. Therefore, in consideration of the provisions of the Aviation Safety Act and the recommendations of ICAO Doc 9859 SMM Edition 4th, personal information in the reporting data and sensitive information of the reporter, etc. It identifies the scope of de-identification targets and suggests a method for applying de-identification processing technology to personal and sensitive information including unstructured text data.

다차원 분석방법을 활용한 중소규모 공동주택 건축심의 의견의 경향과 비정형 데이터로서의 특성분석 (Multidimensional Analysis of Unstructured Data and Trends in Architectural Review Opinions of Small and Medium-Sized Apartment Projects )

  • 김진희;황태언;김재식;허영기
    • 한국건설관리학회논문집
    • /
    • 제24권6호
    • /
    • pp.74-80
    • /
    • 2023
  • 본 연구는 국내 1인 가구수가 증가함에 따라 중소규모 공동주택에 대한 정책적 관심이 높아지는 가운데, 해당 사업 유형의 사업주들이 대비하기 가장 어려운 리스크로 건축심의가 지적되고 있다. 본 연구는 B도시의 25개 중소규모 공동주택 프로젝트에 대해 다차원 분석방법을 적용하여 건축심의 의견의 경향과 비정형데이터로서 건축심의 의견의 특성을 분석하였다. 대응분석 및 MDS 분석을 실시한 결과, 선행연구와 동일하게 B도시의 건축심의 의견은 주로 상위분류에서 '구조'와 '계획'에 관련된 키워드가 주를 이루었다. 즉, 모든 키워드의 출현빈도수 대비 각 상위분류의 빈도수의 합은, 선행연구의 직접분류결과는 '구조' 40%, '계획' 27%이며, 본 연구의 분석결과는 '구조' 44%, '계획' 39%인 것으로 나타났다. MDS모델의 적합도는 34.4%로 비교적 낮은 편이나, 대응분석을 통해 확인한 결과 건축심의의 비정형적 자료의 특성에 기인한 것으로 확인하였다. 또한, 본 연구에서 분석한 건축심의 의견과 같은 비정형적 데이터는 심의위원의 주관과 지자체별 양식에 따라 다양한 데이터의 조합과 출현이 이루어지며, 주로 언급되는 단어와 전혀 다른 키워드가 등장할 수 있어 첨도가 낮고 왜도가 높은 확률분포적 특성을 파악할 수 있었다. 본 연구는 일부 한계점이 있으나, 비정형 데이터로서 건축심의 의견의 특징을 도출해내었으며 추후 세부분석을 위한 기초 연구로서 활용 될 수 있을 것이다.

비정형격자 기반 국지연안 파랑예측시스템 구축을 위한 예측정확도 및 모델성능 비교분석 (Comparative Analysis of Forecasting Accuracy and Model Performance for Development of Coastal Wave Forecasting System Based on Unstructured Grid)

  • 노민;오상명;장필훈;강현석;김형석
    • 한국해안·해양공학회논문집
    • /
    • 제34권6호
    • /
    • pp.188-197
    • /
    • 2022
  • 전지구수치예보모델의 해상풍 예측자료를 기반으로 비정형격자의 국지연안 파랑예측시스템을 구축하고, 파랑모델의 수행성능 및 예측성능을 검증하였다. 기존의 정형격자는 복잡한 해안선과 연안지형에서의 파랑예측이 제한적이기 때문에 정밀한 국지연안 수치모의를 위해 비정형격자체계를 적용하고, 현업 예보 지원에 대한 적용가능성을 검토하였다. 두 격자체계 모두 근해와 연안에서 유사한 예측경향을 보였고, 격자체계에 따른 예측오차의 차이도 크지 않았다. 또한 정형격자와 비교하여, 비정형격자의 모델수행시간이 동일한 조건에서 현저히 감소하는 것을 통해 비정형격자 기반 파랑예측시스템의 현업 예보 지원에 대한 적용가능성을 확인하였다.

아토바스타틴의 새로운 약물 적응증 탐색을 위한 비정형 데이터 분석 (Analysis of Unstructured Data on Detecting of New Drug Indication of Atorvastatin)

  • 정휘수;강길원;최웅;박종혁;신광수;서영성
    • Journal of health informatics and statistics
    • /
    • 제43권4호
    • /
    • pp.329-335
    • /
    • 2018
  • Objectives: In recent years, there has been an increased need for a way to extract desired information from multiple medical literatures at once. This study was conducted to confirm the usefulness of unstructured data analysis using previously published medical literatures to search for new indications. Methods: The new indications were searched through text mining, network analysis, and topic modeling analysis using 5,057 articles of atorvastatin, a treatment for hyperlipidemia, from 1990 to 2017. Results: The extracted keywords was 273. In the frequency of text mining and network analysis, the existing indications of atorvastatin were extracted in top level. The novel indications by Term Frequency-Inverse Document Frequency (TF-IDF) were atrial fibrillation, heart failure, breast cancer, rheumatoid arthritis, combined hyperlipidemia, arrhythmias, multiple sclerosis, non-alcoholic fatty liver disease, contrast-induced acute kidney injury and prostate cancer. Conclusions: Unstructured data analysis for discovering new indications from massive medical literature is expected to be used in drug repositioning industries.

비정형 건축물의 형태 표현특징에 관한 연구 (A Study on the Characteristics of Formal Expression of Atypical Buildings)

  • 강박;홍관선
    • 한국콘텐츠학회논문지
    • /
    • 제21권4호
    • /
    • pp.795-814
    • /
    • 2021
  • 최근 몇 년간 과학기술이 발달하면서, 기존의 건축양식과 디지털 도구가 결합하여 다양한 형태의 비정형 건축물을 구현하기 시작하였는데, 이러한 건축물은 기존의 정형 건축물과는 확연히 다른 형태를 보이고 있다. 디자이너는 비정형 건축물을 구축할 때 다양한 방법이나 디지털 도구를 활용하여 비정형 건축 형태와 보다 자유로운 건축 형식을 완성하게 된다. 이러한 배경을 바탕으로 비정형 건축형태 특성 평가 기준에 대한 연구의 필요성이 제기된다. 첫째, 본문은 비정형 건축물의 외부형태를 주요 연구 대상으로 하여, 선행연구를 바탕으로 비정형 외부 형태 요소를 고찰하고 통합하여 재구성하였다. 둘째, 본 연구의 목적은 다양한 비정형 형태의 유형을 분류하는 동시에 비정형 건축형태의 디지털 프로세스 디자인을 위한 중요한 기초자료를 제공하고자 하였다.셋째, 본문은 2000년부터 2020년까지 비정형 건축물을 주요 연구 대상으로 하고 있으며 그 형태 표현의 특징에 대한 심층적인 분석을 진행하였다. 관련 분야의 연구를 위한 사례 근거를 제공함과 동시에 비정형 건축물의 특징과 관련된 분포 법칙과 존재 가치를 모색하였다. 또한 본 연구에서는 건축물 기능적 용도의 분포와 결합하여 분석을 전개하였으며, 비정형 형태가 용도별로 건축물에 적용되고, 이러한 형태의 적용 추이를 파악하여 비정형 건축물의 형태에 대한 이해를 강화하고자 한 점에서 본 연구는 기존 연구와 차별화된다.

비정형데이터 수집을 통한 드라마 시청률 연관어 분석 (Analysis of drama viewership related words through unstructured data collection)

  • 강선경;이현창;신성윤
    • 한국정보통신학회논문지
    • /
    • 제21권8호
    • /
    • pp.1567-1574
    • /
    • 2017
  • 본 논문에서는 드라마의 시청률에 영향을 미치는 연관어 분석을 위해 정형화된 데이터와 비정형화된 데이터를 분석하는 내용이다. 정형화된 데이터 수집은 각 방송사의 드라마정보, 인물정보, 방송정보, 시청률정보라는 4가지 영역에서 총 19가지항목을 수집하였다. 비정형데이터는 각 방송사에서 드라마별로 운영되고 있는 게시판과 방영전 블로그와 방영후 블로그로부터 크롤링기법을 이용하여 수집하였다. 수집된 정형데이터로부터 각 방송사별 4가지 영역별에 따른 차이를 비교한 결과 방송사별 서로 유사한 결과 값을 보이고 있었다. 그리고 각 방송사의 드라마별 게시판과 블로그에서 수집된 비정형데이터로부터 출현빈도의 상관관계 분석을 통해 관련 연관어를 7개 도출하였다. 도출된 연관어는 신뢰성 분석을 통해 이루어졌다.

키워드 기반 주제중심 분석을 이용한 비정형데이터 처리 (Unstructured Data Processing Using Keyword-Based Topic-Oriented Analysis)

  • 고명숙
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제6권11호
    • /
    • pp.521-526
    • /
    • 2017
  • 데이터는 데이터 형식이 다양하고 방대할 뿐만 아니라 그 생성 속도가 매우 빨라 기존의 데이터 처리 방식이 아닌 새로운 관리 및 분석 방법이 요구된다. 소셜 네트워크 상의 온라인 문서에서 인간의 언어로 쓰여진 비정형 텍스트에서 Text Mining기법을 사용하여 유용한 정보를 추출할 수 있다. 소셜미디어에 남긴 정치, 경제, 문화에 대한 메시지에 대한 경향을 파악하는 것이 어떤 주제에 관심을 가지고 있는지를 파악할 수 있는 요소가 된다. 본 연구에서는 주제 중심 분석 기법을 이용하여 주어진 키워드에 관한 온라인 뉴스를 대상으로 텍스트 마이닝을 수행하였다. LDA(Latent Dirichiet Allocation)를 이용하여 웹문서로부터 정보를 추출하고 이로부터 사람들이 실제로 주어진 키워드에 대하여 어떤 주제에 관심이 있고 관련된 핵심 가치 중 어떤 주제를 중심으로 전파되고 있는지를 분석하였다.

비정형 데이터 분석을 통한 선거 여론조사 예측력 개선 방안 연구 (Prediction improvement of election polls by unstructured data analysis)

  • 박선빈;김명준
    • 응용통계연구
    • /
    • 제31권5호
    • /
    • pp.655-665
    • /
    • 2018
  • 소셜 네트워크 서비스(social network service; SNS)는 개개인의 의견을 공유하거나 소통하는 일반적인 도구로 사용되고 있으며, 특히 정치적인 이슈의 전파 과정에서 타인과의 공유를 통하여 자신이 지지하는 후보에 대한 긍정적인 홍보 등을 통해 여론을 형성 또는 확장한다. 기존의 여론 조사 결과는 응답률, 표본 수집의 방식 등과 관련하여 예측의 정확성에 대한 끊임없는 논란이 되어왔다. 본 논문은 이러한 소셜 네트워크 서비스 상에 존재하는 수많은 비정형 데이터의 감성 분석을 통하여 여론조사의 예측력을 개선, 보완하는 방안을 제시하고자 한다. 제시하고자 하는 연구 내용은 비정형 데이터 크롤링 및 기존에 사용되던 감성 사전에 대한 추가적인 보정 과정을 포함하고 있으며, 이를 통하여 본 논문에서 제안하는 방식은 오차의 감소를 통하여 예측력을 개선하는 결과를 나타냈다.