• 제목/요약/키워드: Predicting Patterns

검색결과 280건 처리시간 0.021초

머신러닝을 활용한 가짜리뷰 탐지 연구: 사용자 행동 분석을 중심으로 (A Study on Detecting Fake Reviews Using Machine Learning: Focusing on User Behavior Analysis)

  • 이민철;윤현식
    • 지식경영연구
    • /
    • 제21권3호
    • /
    • pp.177-195
    • /
    • 2020
  • 소비자 구전은 정보통신기술의 발전과 모바일 기기의 보급 가속화로 그 영향력 또한 급속도로 커지고 있다. 그러나 과도한 마케팅 경쟁은 가짜리뷰와 같은 거짓 온라인 구전을 확산시켰고, 이로 인해 소비자들은 온라인 구전에 대한 피로감과 함께 온라인을 통해 얻게 되는 정보를 불신하는 결과를 초래하고 있으며, 이는 소비자의 합리적 구매 결정 행위에 부정적인 영향을 미치기도 한다. 이에 대한 문제 인식의 확산으로 가짜리뷰의 형태적 특성에 대한 연구를 비롯해 가짜리뷰를 효과적으로 분류하기 위한 다양한 탐지 방법에 대한 연구가 증가하고 있다. 이에 본 연구에서는 네이버 블로그에 작성된 포스트를 대상으로 데이터를 수집하고, 사용자의 무의식에 기반한 습관적 패턴을 머신러닝 모형을 통해 분석해 보았다. 게시물이 작성된 블로그와 그 게시물에서 추출한 변수를 분석하여 향후 가짜리뷰 예측에 활용하고자 하였다. 연구 결과, 광고성 리뷰 예측에 있어 해당 글 작성자의 블로그에 등록된 전체 포스트의 개수와 포스트의 등록 날짜는 매우 높은 상관관계를 보였으며, 해당 포스트가 속한 분류에 등록된 포스트의 개수, 포스트 본문에 사용된 이미지의 개수, 블로그에 포함된 메뉴 개수, 포스트 제목 및 본문의 길이, 포스트가 획득한 '좋아요'의 개수 또한 높은 상관관계를 보였다. 또한 광고성 리뷰 여부를 판단하기 위한 머신러닝 모형에 있어서 랜덤포레스트를 활용한 모형이 가장 우수한 모형으로 확인되었다. 본 연구에서는 블로그에 작성된 리뷰 내용에 대한 형태소 분석을 시행하는 대신 리뷰를 작성한 사람의 행위를 분석하기 위한 시도를 하였다. 이를 위해 블로그와 포스트의 특성 데이터를 수작업이 아닌 웹 크롤링 기법으로 수집하고 머신러닝 모형을 통해 광고성 리뷰 여부를 판별할 가능성을 확인한 점은 향후 가짜리뷰의 빠른 탐지를 위한 효율성 및 효과성 향상에 기여할 수 있을 것이다.

국지홍수 심도예측을 위한 새로운 홍수지수의 개발 (Development of a New Flood Index for Local Flood Severity Predictions)

  • 조덕준;손인욱;최현일
    • 한국수자원학회논문집
    • /
    • 제46권1호
    • /
    • pp.47-58
    • /
    • 2013
  • 최근 들어 전 세계적인 기후변화 양상에 따라 짧은 시간에 큰 유출양상을 보이는 국지적 돌발성 홍수의 발생이 증가하는 추세이며 이로 인한 인명 및 재산의 피해가 국내뿐만 아니라 전 세계적으로 발생하고 있다. 이와 같이 소규모 지역의 집중된 강우로 발생하는 국지적 돌발성 홍수는 빠른 수문반응으로 인하여 홍수피해를 예방하기 위한 예 경보 시간이 부족한 것이 특징이다. 국지 홍수로 인한 피해를 막기 위해서는 한계유량을 초과하여 제내지의 피해발생 가능성이 있는 홍수사상에 대한 심도예측이 중요하다. 본 논문의 목적은 소규모 유역에서 발생하는 홍수사상의 심각성 정도를 정량화할 수 있는 새로운 홍수지수(New Flood Index)를 개발하고 새로운 홍수지수와 강우특성과의 회귀분석을 통하여 국지 돌발홍수예측에 적용하고자 하였다. 2개의 시범유역들에 대한 홍수유출수문곡선은 장기간 관측된 연최대치계열 실측 강우자료를 이용하여 강우-유출 모형을 통하여 산정하였다. 새로운 홍수지수 NFI는 2년 빈도 홍수량으로 가정된 한계유량을 초과하는 홍수사상에 대하여, 첨두홍수량비, 상승부경사, 초과홍수지속시간 등 홍수 유출수문곡선의 특성을 이용한 3가지 상대심도계수의 기하학적 평균값으로산정하였다. 분석결과 3시간최대강우가 새로운 홍수지수NFI와 가장높은 상관관계가 있음을 확인하였다. 새로운 홍수지수와 강우특성과의 회귀분석을 통해 얻어진 최적 관계식은 소규모 미계측 유역에서의 국지적 홍수 심도예측을 위한 예비정보의 기초자료로 활용될 수 있을 것으로 기대된다.

Development of User-Friendly Modeling Software and Its Application in Processed Meat Products

  • Lee, Heeyoung;Lee, Panho;Lee, Soomin;Kim, Sejeong;Lee, Jeeyeon;Ha, Jimyeong;Choi, Yukyung;Oh, Hyemin;Yoon, Yohan
    • 한국식품위생안전성학회지
    • /
    • 제33권3호
    • /
    • pp.157-161
    • /
    • 2018
  • 본 연구에서는 육제품의 다양한 조건(포장, 저장온도, 염농도, 아질산염농도)에서의 식중독세균의 생장을 예측하는소프트웨어를 예측미생물학에 대한 지식이 부족한 비전문가도 손쉽게 이용할 수 있도록 개발하였다. 육제품에서의 식중독세균예측소프트웨어(FAME: Foodborne bacteria Animal product Modeling Equipment)는 Javascript와 HTML을 이용하여 개발하였으며, 육제품에 대한 카이네틱모델과 확률모델을 포함하고있다. FAME에서는 검증(validation) 기능을 포함하고 있으며, FAME에 탑재 되어있는 예측모델의 수식을 자유롭게 수정할 수 있도록 고안 하였다. FAME에는 포장조건, 온도, 염농도, 아질산염농도 조합에 따라 실험한 데이터를 카이네틱모델(5,400 데이터)과 확률모델(345,600 데이터)에 탑재하였다. 사용자가 FAME을 이용하여 육제품의 제조 조건을 소프트웨어에 입력하면, 시간에 따른 식중독세균의 생장패턴과 생장확률이 즉시 계산 되어진다. 따라서 예측 미생물학에 대한 전문 지식이 없는 비전문가라고 하더라도 FAME을 이용하여 직접 실험을 하지 않고도 육제품에서의 식중독세균의 생장을 쉽고 빠르게 예측할 수 있어, 육가공분야에서 매우 유용하게 사용되어 질 수 있을 것으로 판단된다.

Mathematical Model for Predicting the Growth Probability of Staphylococcus aureus in Combinations of NaCl and NaNO2 under Aerobic or Evacuated Storage Conditions

  • Lee, Jeeyeon;Gwak, Eunji;Ha, Jimyeong;Kim, Sejeong;Lee, Soomin;Lee, Heeyoung;Oh, Mi-Hwa;Park, Beom-Young;Oh, Nam Su;Choi, Kyoung-Hee;Yoon, Yohan
    • 한국축산식품학회지
    • /
    • 제36권6호
    • /
    • pp.752-759
    • /
    • 2016
  • The objective of this study was to describe the growth patterns of Staphylococcus aureus in combinations of NaCl and $NaNO_2$, using a probabilistic model. A mixture of S. aureus strains (NCCP10826, ATCC13565, ATCC14458, ATCC23235, and ATCC27664) was inoculated into nutrient broth plus NaCl (0, 0.25, 0.5, 0.75, 1, 1.25, 1.5, and 1.75%) and $NaNO_2$ (0, 15, 30, 45, 60, 75, 90, 105, and 120 ppm). The samples were then incubated at 4, 7, 10, 12 and $15^{\circ}C$ for up to 60 d under aerobic or vacuum conditions. Growth responses [growth (1) or no growth (0)] were then determined every 24 h by turbidity, and analyzed to select significant parameters (p<0.05) by a stepwise selection method, resulting in a probabilistic model. The developed models were then validated with observed growth responses. S. aureus growth was observed only under aerobic storage at $10-15^{\circ}C$. At $10-15^{\circ}C$, NaCl and $NaNO_2$ did not inhibit S. aureus growth at less than 1.25% NaCl. Concentration dependency was observed for NaCl at more than 1.25%, but not for $NaNO_2$. The concordance percentage between observed and predicted growth data was approximately 93.86%. This result indicates that S. aureus growth can be inhibited in vacuum packaging and even aerobic storage below $10^{\circ}C$. Furthermore, $NaNO_2$ does not effectively inhibit S. aureus growth.

Bleomycin 유도 폐 섬유화 쥐 모델에서 미세 전산화단층촬영의 유용성 (Utility of Micro CT in a Murine Model of Bleomycin-Induced Lung Fibrosis)

  • 이재아;진공용;복세미;한영민;박성주;이용철;정명자;윤건하
    • Tuberculosis and Respiratory Diseases
    • /
    • 제67권5호
    • /
    • pp.436-444
    • /
    • 2009
  • Background: Micro computed tomography (CT) is rapidly developing as an imaging tool, especially for mice, which have become the experimental animal of choice for many pulmonary disease studies. We evaluated the usefulness of micro CT for evaluating lung fibrosis in the murine model of bleomycin-induced lung inflammation and fibrosis. Methods: The control mice (n=10) were treated with saline. The murine model of lung fibrosis (n=60) was established by administering bleomycin intra-tracheally. Among the 70 mice, only 20 mice had successful imaging analyses. We analyzed the micro CT and pathological findings and examined the correlation between imaging scoring in micro CT and histological scoring of pulmonary inflammation or fibrosis. Results: The control group showed normal findings on micro CT. The abnormal findings on micro CT performed at 3 weeks after the administration of bleomycin were ground-glass opacity (GGO) and consolidation. At 6 weeks after bleomycin administration, micro CT showed various patterns such as GGO, consolidation, bronchiectasis, small nodules, and reticular opacity. GGO (r=0.84) and consolidation (r=0.69) on micro CT were significantly correlated with histological scoring that reflected pulmonary inflammation (p<0.05). In addition, bronchiectasis (r=0.63) and reticular opacity (r=0.83) on micro CT shown at 6 weeks after bleomycin administration correlated with histological scoring that reflected lung fibrosis (p<0.05). Conclusion: These results suggest that micro CT findings from a murine model of bleomycin-induced lung fibrosis reflect pathologic findings, and micro CT may be useful for predicting bleomycin-induced lung inflammation and fibrosis in mice.

플래쉬 메모리 SSD 기반 해쉬 조인 알고리즘의 성능 평가 (Performance Evaluation of Hash Join Algorithm on Flash Memory SSDs)

  • 박장우;박상신;이상원;박찬익
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권11호
    • /
    • pp.1031-1040
    • /
    • 2010
  • 데이터베이스 관리 시스템의 핵심 알고리즘인 해쉬 조인은 해싱을 위한 메모리가 부족한 경우(즉, 해쉬 테이블 오버플로우) 디스크 입출력를 유발하게 된다 하드디스크를 임시 저장공간으로 사용할 경우, 해쉬 조인의 probing 단계에서 과도한 임의 읽기로 인해 I/O 시간이 성능을 저하시키게 된다. 한편, 플래시메모리 SSD가 저장장치로 각광을 받고 있으며, 머지않아 엔터프라이즈 환경에서 하드디스크를 대체할 것으로 예상 된다 하드디스크와 달리, 기계적인 동작 장치가 없는 플래시메모리 SSD의 경우 임의 읽기에서 빠른 성능을 보이기 때문에 해쉬 조인의 성능을 크게 향상시킬 수 있다. 본 논문에서는 플래시 메모리 SSD를 해쉬 조인을 위한 임시 저장공간으로 사용할 경우의 몇 가지 중요하고 현실적인 이슈들을 다룬다. 우선, 해쉬 조인의 I/O 패턴을 자세히 설명하고, 하드디스크에 비해 플래시메모리 SSD가 수십 배에 가까운 성능 향상을 보이는 이유를 설명한다. 다음으로, 클러스터 크기(즉, 해쉬 조인 알고리즘에서 사용하는 I/O 단위)가 성능에 미치는 영향을 제시하고 분석한다. 마지막으로, 하드디스크의 경우, DBMS의 질의 최적화기가 산출하는 비용이 실 수행시간과 편차가 클 수 있는데 반해, 플래시메모리 SSD의 경우 비용 산출을 정확히 하게 됨을 실험적으로 보인다. 결론적으로, 플래시메모리 SSD를 해쉬 조인을 위한 임시 저장공간으로 사용할 경우, 빠른 성능과 더불어 질의 최적화기의 비용 산출이 훨씬 더 신뢰할 수 있음을 보인다.

기계학습과 시뮬레이션 기법을 융합한 교통 상태 예측 방법 개발 연구 (A Study on Traffic Prediction Using Hybrid Approach of Machine Learning and Simulation Techniques)

  • 김예은;김성훈;여화수
    • 한국ITS학회 논문지
    • /
    • 제20권5호
    • /
    • pp.100-112
    • /
    • 2021
  • 빅데이터의 등장과 더불어 교통 상태 예측은 과거 이력 데이터 분석 방식에 힘을 싣고 발전되어 왔으나, 이 방법은 관측된 적 없는 돌발 상황에 충분히 대응하지 못한다는 약점이 있다. 본 연구에서는 기계학습과 시뮬레이션 기법의 융합을 통해 돌발 상황 발생 시 교통 상태 예측 정확도 감소를 보완할 수 있는 예측 기법을 제시한다. 데이터 기반 방식의 맹점은 과거에 관측된 적 없는 데이터 패턴이 인지되었을 때 드러난다. 본 연구에서는 시뮬레이션을 이용하여 과거 이력 데이터를 보강하는 방법으로 문제를 해결하고자 하였다. 제시한 방법은 기계학습 기반의 교통 예측을 수행하고, 예측 결과와 실시간으로 수집되는 교통 데이터를 지속적으로 비교하여 돌발 상황 발생 여부를 판단한다. 돌발 상황이 인지되었을 시, 시뮬레이션을 통해 생성한 데이터베이스를 활용하여 예측을 수행한다. 본 연구에서 제시한 방법은 실제 도로 구간을 대상으로 검증되었으며, 검증 결과 돌발 상황에서의 교통 상태 예측 정확도 향상을 확인할 수 있었다. 본 연구에서 제시한 융합 교통 예측 방법은 향후 교통 예측 고도화에 이바지할 수 있을 것으로 전망된다.

코르셋 타입 하네스의 신체 하중압력 분포 측정 및 가상착의 적용 (Investigation of the body distribution of load pressure and virtual wear design according to the corset type harness)

  • 권미연;최솔아;김주혜
    • 한국의상디자인학회지
    • /
    • 제23권3호
    • /
    • pp.1-10
    • /
    • 2021
  • Harnesses are used in a variety of industries, such as rescue operations, medicine, and entertainment. However, conventional harnesses have problems as they are uncomfortable to wear and causes continuous pain. Therefore, in this study, the load and pressure applied to the body in the flying state when using a conventional harness were measured in real time and the distribution change was observed. Load and pressure were measured using a modified corset harness, a pressure sensor, and a human mannequin to measure the maximum and average pressure on the waist. As a result, it was confirmed that the load concentrated on the waist in the flying state was 104 N, and the pressure was applied to the left and right sides was 800 kPa or greater. The pressure distribution showed a pressure of 3-45 kPa in 73% in all measurable pressures. The results of the load and pressure distribution are presented as basic data for improving the wearability and reducing the discomfort of harnesses in the future, aid in the development of a harnesses that can minimize discomfort for various activities, and increase the concentration on experiential activities. In addition, using the CLO 3D program, which is a 3D virtual wearing system, a harness was put on a virtual model, and the compression level was checked and compared with the actual pressure distribution. As a result of comparing the measured pressure values in the flying state with the clothing pressure wearing the harness in the CLO 3D program, the total pressure value was found to be about 68% of the actual measured value. This helps develop a harness that can minimize discomfort during activities by predicting the load and pressure on the body by first applying new designs to a virtual wearing system during development. These new harness patterns can solve the problems of conventional harnesses.

지리정보시스템을 이용한 한국산 참개구리와 금개구리의 생태적 지위와 종간 경쟁에 대한 연구 (Ecological Niche and Interspecific Competition of Two Frog Species (Pelophylax nigromaculatus and P. chosenicus) in South Korea using the Geographic Information System)

  • 안정윤;최서윤;김형근;서재화;도민석
    • 생태와환경
    • /
    • 제54권4호
    • /
    • pp.363-373
    • /
    • 2021
  • 생태적 지위는 생물 종이 차지하는 특정 지위 또는 역할로 시간과 공간, 먹이자원에 의해 주요한 영향을 받으며, 중첩 정도에 따라 종간 경쟁관계를 밝혀낼 수 있기 때문에 지리정보시스템을 기반으로 다양한 연구들이 수행되고 있다. 본 연구에서는 한국에 서식하고 있는 Pelophylax속 참개구리(P. nigromaculatus)와 금개구리(P. chosenicus) 두 종의 공간적 생태정보를 통해 생태적 지위를 알아보고, 지리적 분포 범위를 예측하여 종간 공존지역과 분포 패턴에 대하여 알아보았다. 그 결과 두 종의 분포에 영향을 끼친 주요 변수는 고도로 확인되었으며, 고도는 종들이 분포한 기후와 상관관계를 나타내고 있었다. 두 종이 분포한 생태적 지위는 매우 높게 중첩되어 있었으며, 참개구리가 분포한 지역은 금개구리가 분포한 대부분 지역을 포함하는 동소적인 분포 패턴을 보였다. 공존하고 있는 지역에서 두 종이 출현한 지점들은 음의 상관관계를 나타내고 있어, 약한 경쟁이 발생하고 있음을 암시했다. 비록 본 연구에서는 종간 동소적 분포 형태를 나타낸 원인과 경쟁관계에 영향을 주는 주요한 요인에 대해서는 확인하지 못했지만, 추후 미시적인 관점에서 두 종이 함께 공존하는 지역을 대상으로 다양한 환경변수들에 대한 보다 세밀한 분석(필지, 수로, 논둑 등)이 수행된다면 종간 경쟁을 최소화하는 다양한 기작들을 확인할 수 있을 것이라고 판단된다.

기계학습을 통한 여름철 노면상태 추정 알고리즘 개발 (Estimation of Road Surface Condition during Summer Season Using Machine Learning)

  • 여지호;이주영;김강화;장기태
    • 한국ITS학회 논문지
    • /
    • 제17권6호
    • /
    • pp.121-132
    • /
    • 2018
  • 기상은 교통흐름, 운전자의 주행패턴, 교통사고 등 여러 방면에서 도로교통에 영향을 미치는 중요한 요인이다. 본 연구는 기상상황과 노면상태 사이의 관계에 초점을 맞추어 기계학습을 통해 도로의 노면상태를 추정하는 모델을 개발하였다. 노면 상태의 수집을 위해 실험 차량에 노면센서를 부착하여 '건조', '습윤', '젖음', 3가지 범주로 구분된 노면상태 정보를 수집하였고, 이를 추정하기 위한 변수로 도로의 기하구조 정보(곡률, 구배), 교통정보(교통량), 기상정보(강우량, 습도, 온도, 풍속)를 활용하였다. 노면 상태를 예측하기 위한 알고리즘으로는 다양한 기계학습 알고리즘이 검토되었으며, 그 중 가장 높은 정확도를 보인 'Random forest'를 기반으로 한 2단계 분류모형을 구축하였다. 총 16일의 실측 데이터 중 14일의 데이터를 모델을 학습하는 데 활용하였고, 2일의 데이터를 모형의 정확도를 검증하기 위해 사용하였다. 그 결과 81.74%의 검증 정확도를 가지는 노면상태 예측 모델을 구축하였다. 본 연구의 결과는 기상청에서 관측하는 기상정보로 도로의 노면상태를 추정할 수 있다는 가능성을 보여주며, 새로운 장비나 센서를 설치하지 않고도 기존의 기상 관측 정보와 교통정보 등을 활용하여 노면의 상태를 추정할 수 있음을 시사한다.