• 제목/요약/키워드: 선형회귀 모델

검색결과 440건 처리시간 0.029초

앙상블 머신러닝 모델 기반 유튜브 스팸 댓글 탐지 (Ensemble Machine Learning Model Based YouTube Spam Comment Detection)

  • 정민철;이지현;오하영
    • 한국정보통신학회논문지
    • /
    • 제24권5호
    • /
    • pp.576-583
    • /
    • 2020
  • 이 논문은 최근 엄청난 성장을 하고 있는 유튜브의 댓글 중 스팸 댓글을 판별하는 기법을 제안한다. 유튜브에서는 광고를 통한 수익 창출이 가능하기 때문에 인기 동영상에서 자신의 채널이나 동영상을 홍보하거나 영상과 관련 없는 댓글을 남기는 스패머(spammer)들이 나타났다. 유튜브에서는 자체적으로 스팸 댓글을 차단하는 시스템을 운영하고 있지만 여전히 제대로 차단하지 못한 스팸 댓글들이 있다. 따라서, 유튜브 스팸 댓글 판별에 대한 관련 연구들을 살펴 보고 인기 동영상인 싸이, 케이티 페리, LMFAO, 에미넴, 샤키라의 뮤직비디오 댓글 데이터에 6가지 머신러닝 기법(의사결정나무, 로지스틱 회귀분석, 베르누이 나이브 베이즈, 랜덤 포레스트, 선형 커널을 이용한 서포트 벡터 머신, 가우시안 커널을 이용한 서포트 벡터 머신)과 이들을 결합한 앙상블 모델로 스팸 탐지 실험을 진행하였다.

1차원 합성곱 신경망에 기반한 모바일 연속 혈압 측정 시스템의 설계 및 구현 (Design and Implementation of Mobile Continuous Blood Pressure Measurement System Based on 1-D Convolutional Neural Networks)

  • 김성우;신승철
    • 한국정보통신학회논문지
    • /
    • 제26권10호
    • /
    • pp.1469-1476
    • /
    • 2022
  • 최근 심전도 (ECG) 및 광전용맥파 (PPG) 신호를 사용하여 혈압을 추정하는 많은 연구가 이루어지고 있다. 본 논문에서는 1차원 합성곱 신경망을 사용하여 실시간으로 혈압을 추정하고 모니터링 할 수 있는 모바일 시스템을 설계하고 구현하였다. 제안하는 신경망 알고리즘은 ECG 및 PPG 신호의 다양한 특징을 세밀하게 추출하도록 11개의 계층으로 구성하고 매개변수를 최적화하도록 설계되었다. 모의실험 결과는 학습한 신경망의 합성곱 커널의 개수가 많을수록 ECG 및 PPG 신호의 특성을 더 잘 나타내기 때문에 선형 회귀 모델보다 평균 제곱 오차가 적어져 더 좋은 성능을 나타내는 것으로 분석되었다. 본 연구에서 개발된 모바일 시스템은 몸에 부착된 ECG 및 PPG 센서 장치로부터 블루투스 통신으로 전송된 측정 신호를 입력받고 실시간으로 학습된 모델로 수축기 및 이완기 혈압 수치를 추정하고 그래프로 표시하게 된다.

유한요소모델 기반 장력추정 기법의 비교 연구 (A Comparative Study of Finite Element Model-Based Tension Estimation Techniques)

  • 박규식;이정휘;성택룡;윤태양;김병화
    • 한국강구조학회 논문집
    • /
    • 제21권2호
    • /
    • pp.165-173
    • /
    • 2009
  • 현수교 행어케이블은 일부가 클램프로 구속되어 있어 단일 케이블 모델을 기반으로 한 기존의 장력추정 방법들은 휨감성의 영향이 큰 짧은 케이블 일수록 오차가 커지게 된다. 따라서 최근에 유한요소모델 기반의 역해석 기법 및 시스템인식 기법을 이용한 장력추정 방법이 제안되었다. 본 논문은 광안대교 행어케이블을 대상으로 역해석 기법 및 시스템인식 기법을 이용한 장력추정 방법의 적용성을 비교 검토 하였다. 장력추정결과 유한요소모델을 기반으로 한 역해석 기법 및 시스템인식 기법은 기존의 현이론 및 선형회귀법에 의한 장력추정 방법에 비해 고유진동수 오차를 기준으로 보다 높은 신뢰성을 가지고 장력을 추정하였다. 하지만 모델기반의 장력추정 방법은 유한요소모델의 정확도에 따라 그 오차가 다르게 나타날 수 있다. 특히, 짧은 케이블 일수록 경계조건의 영향을 많이 받기 때문에 가능하다면 실험을 통해 경계조건을 명확히 파악하는 것이 중요하다. 시스템인식 기법을 이용한 장력추정 방법은 다양한 경계조건을 용이하게 고려할 수 있으며, 또한 입력되는 계측 고유진동수의 개수에 민감하지 않기 때문에 그 효용성이 높다고 할 수 있다.

횡하중하의 포스트 텐션 플랫 플레이트 해석을 위한 강성감소계수 (Stiffness Reduction Factor for Post-Tensioned Flat Plate Slabs under Lateral Loads)

  • 박영미;박진아;한상환
    • 콘크리트학회논문집
    • /
    • 제21권5호
    • /
    • pp.661-668
    • /
    • 2009
  • 횡하중을 받는 포스트 텐션(PT) 플랫 플레이트 슬래브 골조의 해석은 일반적으로 유효보폭모델을 많이 사용한다. 횡 변위비와 불균형 모멘트을 예측하기 위한 유효보폭모델의 정확성은 PT 플랫 플레이트 슬래브의 유효강성을 어떻게 평가하느냐에 달려 있다. 슬래브 강성은 횡하중에 의한 작용모멘트의 증가와 함께 감소되기 때문에, 슬래브의 강성 감소현상은 플랫 플레이트 골조의 해석에 반영되어야 하며 균열의 영향 또한 고려되어야 한다. 횡하중을 받는 PT 플랫 플레이트 슬래브 구조의 정확한 해석을 위해 슬래브 강성감소는 유효보폭모델이 정확하게 되어야 한다. 이 목적을 위해 이 연구는 기존 연구자들에 의해 실시된 PT 플랫 플레이트 내부 및 외부 접합부의 실험 결과를 수집하였다. 그리고 이 연구는 시행착오를 통해 각 실험체의 횡강성에 유효보폭모델의 강성이 수렴하도록 슬래브의 폭을 감소시켰다. 슬래브의 모멘트 크기에 따라 비선형 회귀 분석을 수행함으로서 슬래브에 대한 강성감소계수 계산식을 제안하였다. 이 연구에서는 제안된 식의 정확성을 검증하기 위해서 PT 플랫 플레이트 골조의 실험 결과와 비교하였다. 제안된 식을 적용한 유효보폭모델은 작용하중의 크기에 따라 변화하여 PT 실험체의 실제 강성을 잘 예측하는 것으로 나타났다.

모바일 폰의 카메라와 LCD 모듈간의 RGB 참조표에 기반한 색 정합의 구현 (Implementation of the Color Matching Between Mobile Camera and Mobile LCD Based on RGB LUT)

  • 손창환;박기현;이철희;하영호
    • 대한전자공학회논문지SP
    • /
    • 제43권3호
    • /
    • pp.25-33
    • /
    • 2006
  • 본 논문에서는 모바일 카메라와 모바일 LCD 간의 컬러 충실도를 높이기 위한 3차원 RGB 참조표에 기반한 장치 독립적인 색 정합 방법을 제안하였다. 제안한 색 정합 방법은 크게 모바일 디스플레이(LCD) 및 카메라의 장치 특성화, 색역 사상, 대표색에 기반한 3차원 참조표 설계로 구성된다. 먼저, 모바일 디스플레이의 장치 특성화 과정은 전기-빛 입출력의 특성으로부터 기존의 CRT 모니터에 적용된 GOG(Gai Offset Gamma) 모델이나 LCD 모니터에 적용된 S-curve 모델과는 다른, Sigmoidal 함수를 사용해서 모델링되었고, 모바일 카메라의 장치 특성화는 표준(D65)환경하에서 촬영된 컬러 차트의 디지털 값(RGB)과 표준 색 자극치 데이터(CIELAB, CIEXYZ)를 다항 회귀 방정식에 대입해서 모델링되었다. 그리고 다항 회귀 방정식으로부터 획득된 표준 색 자극치 데이터는 카메라 장치 특성화 모델링의 특성으로 인해 표준 색 공간의 최대 값을 초과할 수 있기 때문에, 선형적인 채도와 밝기 압축 과정을 통하여 보정되었다. 마지막으로, 표준 환경하에서의 모바일 카메라의 색역과 모바일 디스플레이 장치의 색역의 차이를 보상하기 위해, 경계면 설정과 다중-닻 점 색역 사상 기법이 수행되었다. 이러한 장치 독립적인 색 정합 처리 과정을 실시간으로 구현하기 위해 대표색에 기반한 3차원 참조표를 설계하여, 참조표에 기반한 장치 독립적인 색 재현의 정량적인 화질을 평가하고, 기존의 장치 의존적인 방법과 성능을 비교 분석하였다.

유튜브 먹방과 온라인 배달 주문: 영향력 분석과 예측 모형 (Youtube Mukbang and Online Delivery Orders: Analysis of Impacts and Predictive Model)

  • 최사라;이상용
    • 지능정보연구
    • /
    • 제28권4호
    • /
    • pp.119-133
    • /
    • 2022
  • 음식 문화 및 산업과 관련한 대표적 특징들 중에는 음식 배달 주문 산업이 성장하고 있다는 것과 유튜브와 같은 1인 미디어에서의 소위 '먹는 방송' (먹방)이 최고의 인기 콘텐츠로 자리 잡았다는 사실 등을 거론할 수 있다. 본 연구는 이러한 배경에 근거하여 두가지 초점을 두어 연구하고자 하였다. 먼저, 유튜브 먹방과 먹방 댓글에서 확인되는 대중들의 감성이 관련 음식의 배달 이용 건수에 영향을 미치는지를 회귀분석 모형을 통하여 확인하고자 하였다. 다음으로, 대한민국에서 대표적인 주문 음식인 치킨의 배달 이용 건수 데이터와 유튜브 먹방 댓글 데이터와 날씨 데이터를 활용하여, 머신 러닝을 통한 치킨 배달 주문 예측 모형을 구현하였다. 2015년 6월 3일부터 2019년 9월 30일까지 총 1,580개의 데이터를 활용하였고, 날씨 변수로서의 온도, 습도, 강수량과 유튜브 먹방 변수로의 영상에 달린 댓글 수, 댓글의 긍정어 수, 중립어 수, 부정어 수 등을 수집하였다. 본 연구에 활용된 데이터의 유튜브 먹방과 먹방 댓글의 감성이 배달 이용 건수에 영향 미침을 확인하기위해 선형 회귀 방법론을 사용하였으며, 예측모델을 위해 사용된 머신 러닝은 Linear Regression, Ridge, Lasso, Random Forest, Gradient Boost이다. 본 연구를 통해 유튜브 먹방과 댓글의 감성이 배달 이용 건수에 영향 미침을 확인하였고 예측 모형 또한 기존 모델보다 성능이 좋아짐을 Root Mean Square Error 값을 통하여 확인하였다. 본 연구는 먹방의 광고 효과를 확인하였으며, 배달 업종에서의 경영에 활용할 수 있는 함의를 제공하고자 하였다.

제주지역 소아의 경골 염전 (Tibial Torsion in Children of the Jeju Area)

  • 송동호;은백린;박상희;이준영;독고영창
    • Clinical and Experimental Pediatrics
    • /
    • 제48권1호
    • /
    • pp.75-80
    • /
    • 2005
  • 목 적 : 일본이나 우리나라처럼 좌식생활을 많이 하는 동아시아국가에서는 경골 내염전이 많은 것으로 알려져 있다. 경골 내염전이나 지나친 경골 외염전은 미용적인 문제, 기능적인 문제, 정신적인 문제를 일으킬 수 있으며, 성인에서 퇴행성관절염과 연관성이 있는 것으로 보고되고 있다. 이에 제주지역 정상소아를 대상으로 경골 염전의 정도를 알아보기 위하여 본 연구를 시행 하였다. 방 법 : 제주지역 아동을 대상으로 1-12세 사이의 521명, 1,042족을 대상으로 복사 통과 각도를 측정하였으며 나이를 6개월 간격으로 구분하여 분석하였다. 평균 복사 통과 각도의 변화 양상을 적합하기 위하여 2차 회귀 모델과 선형회귀 모델을 사용하였다. 2차 회귀분석에 대해 가장 높은 결정계수를 보여주는 7세가 서로 다른 통계모형에 적합하는 기준점으로 사용되었다. 결 과 : 전체 아동의 평균 복사 통과 각도는 $0.10{\pm}5.79^{\circ}$이었으며, 남아의 평균 복사통과각도는 $0.90{\pm}5.49^{\circ}$, 여아의 평균 복사 통과 각도는 $-0.80{\pm}5.97^{\circ}$이었다. 평균 복사 통과 각도는 1세에 $4.25{\pm}4.04$에서 나이가 들면서 점차 감소하여 4년 7개월에 $-1.98^{\circ}$로 가장 낮은 값을 보였으며 이후 나이가 들면서 점차 증가하여 7세 이후는 $0.67{\pm}1.10^{\circ}$로 일정하게 유지되었다. 결 론 : 영아기의 경골 내염전은 정상적인 성장 발달 과정에서 저절로 좋아지는 것으로 알려져 있다. 그러나 본 연구에서는 우리나라 아동의 경우 오히려 1세 이후 복사 통과 각도가 해마다 감소하여 4년 7개월에서 최저 각도를 보이고 이후 다시 점차 증가하여 7세 이후에 더 이상 교정되지 않고 경골 외염전이 서양 아동들에 비해 약 $10^{\circ}$ 정도 감소한 상태에서 지속되었다. 이는 우리의 전통적인 생활 방식 특히 무릎을 꿇어앉는 습관에 기인하는 것으로 보인다. 따라서 관절과 보행의 이상을 예방하기 위하여 아동기에 경골 염전의 이상을 조기 발견하여 자세를 교정하여주고 필요한 경우에는 조기에 치료를 해줄 필요가 있다고 생각된다. 아울러 우리나라 아동기의 경골 염전에 대한 연구가 보다 폭넓게 이루어져야 될 것으로 생각된다.

CART 분석을 이용한 지하철 마모 영향인자 분석 (Analysis of Factors Influencing upon the Metro Wear Using the Classification and Regression Trees)

  • 정민철;이원우;김정훈;공정식
    • 한국방재학회:학술대회논문집
    • /
    • 한국방재학회 2011년도 정기 학술발표대회
    • /
    • pp.38-38
    • /
    • 2011
  • 일반적으로 레일마모는 열차의 주행안전 및 승차감에 미치는 영향이 크고, 소음 진동의 주요원인으로 작용한다. 또한 레일마모가 발생할 경우 궤도구조의 파괴를 촉진시킴으로써 차량 및 궤도유지보수비를 크게 증가시킨다. 따라서 구간 특성 및 환경 영향 인자 등 현장에서 발생하는 마모 원인을 체계적으로 분석함으로써 마모를 저감할 수 있도록 차량운행 조건과 선로선형 및 궤도구조를 설계하는 것은 중요한 과제이다. CART(Classification And Regression Tree; 분류와 회귀나무) 분석은 패키지화된 좋은 분류 및 예측도구 기법으로 나무의 상위 분리수준에서 일반적으로 나타나는 가장 중요한 입력변수들을 사용하는 등의 입력변수를 선정하는 경우 매우 유용하다. 본 연구에서는 다변수 구간특성 및 환경인자를 고려한 검측 자료 상관관계 분석을 위한 회귀 나무기반 모델(TBM: Tree Based Model) 분석 수행을 위해 지하철 2호선 마모 데이터와 마모 데이터에 영향을 미치는 각종 다변수 구간특성 및 환경인자를 사용하였다. 2호선 지하철의 구간특성 인자 및 환경인자는 레일의 종류, 레일의 위치, 도상, 곡률반경, 캔트 슬랙 및 운행 일수 등으로 구분하였다. 레일의 종류는 ks-50kg과 ks-60kg 두 종류의 레일이 있으며, 레일의 위치는 지상과 지하로 크게 구분할 수 있다. 도상은 콘크리트 도상, 자갈 도상과 일부 구간의 방진상 콘크리트 도상으로 구분할 수 있으며, 곡률반경은 직선구간과 완화곡선 구간 및 최소 250m부터 627m까지 분포된 원 곡선 구간으로 구분할 수 있다. 캔트 간격은 최소 96cm 부터 120cm 간격으로 구분하며, 슬랙은 5~9cm에 분포하고, 운행 기간은 해당 기간 동안 유지보수 이력이 없는 구간을 선정하여 2005년부터 2006년까지 4번에 걸쳐 검측된 지하철 2호선 내선 마모데이터를 사용하였다. 총 X1부터 X7까지 총 7개의 구간특성 또는 환경특성을 영향인자로 선정하였으며, 이러한 영향인자에 의해 결정되는 종속 인자로 Y1인 직마모와 Y2인 측마모를 선정하여 이 중 실질적으로 지하철 궤도의 성능 평가에 주요 판단인자로 사용되는 측마모와 구간특성 및 환경영향인자와의 상관관계 분석을 수행하였다. 해당 마모 데이터가 검측되는 기간 동안 유지보수 이력이 없는 12272 point의 데이터를 검출하였고 CART 프로그램을 이용하여 데이터를 분석하였으며, CART 프로그램의 해석을 위해 종속변수인 직마모량은 각 검측 지점의 마모량에 해당하는 등급으로 변환하여 분석을 수행하였다. 레일의 마모에 영향을 미치는 구간특성 및 환경인자와 종속 변수로 사용된 레일의 마모량 사이의 CART를 이용한 상관관계 분석은 실제 구조물에서 영향인자간의 상관 관계와 유사하며, 추후 연구에서는 이를 바탕으로 하여 정량화된 검측 데이터를 종속변수로 하여 구간특성 또는 환경인자 등 외부 영향인자를 고려한 궤도 검측데이터와의 상관관계 분석을 수행할 계획이다.

  • PDF

흰띠명나방의 온도발육 모형 (Temperature-dependent Development Model of Hawaiian Beet Webworm Spoladea recurvalis Fabricius (Lepidoptera: Pyraustinae))

  • 이상구;김주;정성수;김연국;이상계;황창연
    • 한국응용곤충학회지
    • /
    • 제52권1호
    • /
    • pp.5-12
    • /
    • 2013
  • 비트의 주요 해충인 흰띠명나방을 9개의 다른 온도조건(15.0, 17.5, 20.0, 22.5, 25.0, 27.5, 30.0, 32.5 및 $35.0^{\circ}C$), 상대습도 $65{\pm}5%$, 광조건 16L:8D에서 발육특성을 조사한 결과, 알에서 성충 우화 전까지의 발육기간은 $17.5^{\circ}C$에서 51.0일로 가장 길었고, $35^{\circ}C$에서 14.6일로 가장 짧게 조사되었다. 온도와 발육율의 관계를 직선회귀에 의해 분석한 결과, 결정계수($R^2$) 값이 0.87 이상으로 나타났으며, 온도에 따른 발육은 직선회귀에 부합되었다. 알부터 성충 우화 전까지의 발육영점온도와 유효적산온도는 $10.4^{\circ}C$와 384.7일도를 나타내었다. 각 태별 발육모형은 $R^2$값이 0.97~0.99로 비선형회귀식에 잘 부합되었다. 각 태별 발육누적분포와 발육기간에 대한 평균 발육기간으로 나눈 값을 Weibull 함수에 적용한 결과 $r^2$값이 0.63~0.87이었다.

머신러닝 기법과 TBM 시공정보를 활용한 토압식 쉴드TBM 굴진율 예측 연구 (A Study on Prediction of EPB shield TBM Advance Rate using Machine Learning Technique and TBM Construction Information)

  • 강태호;최순욱;이철호;장수호
    • 터널과지하공간
    • /
    • 제30권6호
    • /
    • pp.540-550
    • /
    • 2020
  • 최근 AI 기술의 발전과 정립으로 자동화 분야에서 머신러닝 기법의 활용이 활발하게 이루어지고 있다. 머신러닝 기법의 활용에 있어 중요한 점은 데이터 특성에 따라 적합한 알고리즘이 존재한다는 점이며, 머신러닝 기법 적용을 위한 데이터세트의 분석이 필요하다. 본 연구에서는 다양한 머신러닝 기법을 기반으로 하천 하부의 토사지반을 통과하는 토압식 쉴드TBM 터널 구간의 지반정보와 굴진정보를 사용하여 토압식 쉴드TBM의 굴진율을 예측하였다. 선형회귀모델에서 모델의 통계적인 유의성과 다중공선성에서는 문제가 없었으나 결정계수가 0.76으로 나타났고 앙상블 모델과 서포트 벡터 머신에서는 0.88이상의 예측성능을 보여, 분석한 데이터세트에서 토압식 쉴드TBM 굴진성능예측에 적합한 모델은 서포트 벡터 머신임을 알 수 있었다. 현재 도출된 결과로 볼 때, 토압식 쉴드TBM의 기계데이터와 지반정보가 포함된 데이터를 활용한 굴진성능 예측 모델의 적합성은 높다고 판단된다. 추가적으로 지반조건의 다양성과 데이터양을 늘리는 연구가 필요한 것으로 판단된다.