• 제목/요약/키워드: 선택적 바이그램

검색결과 9건 처리시간 0.024초

낚시성 인터넷 신문기사 검출을 위한 특징 추출 (Feature Extraction to Detect Hoax Articles)

  • 허성완;손경아
    • 정보과학회 논문지
    • /
    • 제43권11호
    • /
    • pp.1210-1215
    • /
    • 2016
  • 스마트 기기의 발달로 많은 사람들이 인터넷 신문기사를 이용하고 있다. 하지만 인터넷 언론사간의 치열한 경쟁으로 조회수를 올리기 위한 낚시성 기사가 범람하고 있다. 낚시성 신문기사는 제목을 통해 올바른 기사의 줄거리가 제공되지 않았을 뿐만 아니라, 독자로 하여금 잘못된 내용을 떠올리게 한다. 낚시성 신문기사는 핵심에서 벗어난 유명인사 인용, 애매한 문장의 마무리, 제목과 내용의 불일치 등의 특징을 갖는다. 본 논문에서는 이러한 낚시성 기사를 분류하기 위한 특징을 추출하고 성능을 검증해 본다. 기사에 달린 댓글의 키워드를 활용하여 대용량 학습데이터를 생성하고 이를 기반으로 다섯 가지 분류 특징을 추출하였다. 추출된 특징들은 서포트 벡터 머신 분류기를 이용한 실험에서 92%의 정확도를 보여 낚시성 인터넷 신문기사를 분류하는데 적합하다고 판단된다. 뿐만 아니라 제목과 본문의 일관성을 측정하기 위한 전처리 방법으로 고안한 선택적 바이그램 모델은 낚시성 인터넷 신문기사 분류 외에도 일반적인 단문 분석을 위한 전처리 방법으로 유용할 것으로 기대된다.

듀얼 SMS 스팸 필터링: 그래프 기반 자질 가중치 기법 (Dual SMS SPAM Filtering: A Graph-based Feature Weighting Method)

  • 황재원;고영중
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2014년도 제26회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.95-99
    • /
    • 2014
  • 본 논문에서는 최근 급속히 증가하여 사회적 이슈가 되고 있는 SMS 스팸 필터링을 위한 듀얼 SMS 스팸필터링 기법을 제안한다. 지속적으로 증가하고 새롭게 변형되는 SMS 문자 필터링을 위해서는 패턴 및 스팸 단어 사전을 통한 필터링은 많은 수작업을 요구하여 부적합하다. 그리하여 기계 학습을 이용한 자동화 시스템 구축이 요구되고 있으며, 효과적인 기계 학습을 위해서는 자질 선택과 자질의 가중치 책정 방법이 중요하다. 하지만 SMS 문자 특성상 문장들이 짧기 때문에 출현하는 자질의 수가 적어 분류의 어려움을 겪게 된다. 이 같은 문제를 개선하기 위하여 본 논문에서는 슬라이딩 윈도우 기반 N-gram 확장을 통해 자질을 확장하고, 확장된 자질로 그래프를 구축하여 얕은 구조적 특징을 표현한다. 학습 데이터에 출현한 N-gram 자질을 정점(Vertex)으로, 자질의 출현 빈도를 그래프의 간선(Edge)의 가중치로 설정하여 햄(HAM)과 스팸(SPAM) 그래프를 각각 구성한다. 이렇게 구성된 그래프를 바탕으로 노드의 중요도와 간선의 가중치를 활용하여 최종적인 자질의 가중치를 결정한다. 입력 문자가 도착하면 스팸과 햄의 그래프를 각각 이용하여 입력 문자의 2개의 자질 벡터(Vector)를 생성한다. 생성된 자질 벡터를 지지 벡터 기계(Support Vector Machine)를 이용하여 각 SVM 확률 값(Probability Score)을 얻어 스팸 여부를 결정한다. 3가지의 실험환경에서 바이그램 자질과 이진 가중치를 사용한 기본 시스템보다 F1-Score의 약 최대 2.7%, 최소 0.5%까지 향상되었으며, 결과적으로 평균 약 1.35%의 성능 향상을 얻을 수 있었다.

  • PDF

가상박물관 활용을 통한 박물관 전문인력의 디지털 역량 강화 방안 연구 (A Study of Building Digital Capacity of Museum Professionals through the Use of Virtual Museum)

  • 김선미;이종욱
    • 한국콘텐츠학회논문지
    • /
    • 제22권10호
    • /
    • pp.39-46
    • /
    • 2022
  • 사회 전반적인 디지털 전환은 코로나 바이러스의 유행과 함께 급속도로 진행되고 있다. 특히 문화유산 및 박물관 분야에 있어 디지털 전환은 문화유산의 보존, 관리, 활용의 전반에 걸쳐 이루어지고 있다. 이에 대응하기 위해 디지털 문화유산 정보를 선택, 활용하기 위한 박물관 전문인력의 디지털 리터러시 함양의 중요성이 높아지고 있다. 하지만 현재의 박물관 전문인력의 디지털 역량 교육은 일방향적인 이론과 일방향적 실습 교육으로 디지털 리터러시 함양에는 이르지 못하고 있다. 이를 극복하기 위해 우리는 가상박물관을 활용한 디지털 역량강화 프로그램을 제안한다. 우리는 참여적 박물관, 협동학습, 프로젝트 기반 학습 이론을 기반으로 한 교육 커리큘럼을 제안한다. 학습자는 디지털 문화유산 정보의 획득, 선택, 활용하는 전 과정을 개별, 협동, 상시, 전시물, 프로젝트 기반 학습 프로그램을 통해 경험한다. 우리는 전문가로부터 교육적 측면, 박물관 교육 측면, ICT 기술 교육 측면에서 평가받아 그 활용성을 입증하고 개선점을 도출하였다. 본 연구는 박물관 전문인력의 디지털 역량 강화에 기여할 것이다.

간호대학생의 전공선택동기가 전공만족도, 대학생활만족도 및 자기주도 학습능력에 미치는 영향 (Effect of Motive for Major Selection on Major Satisfaction, Campus-life Satisfaction, and Self-directed Learning Ability among Nursing Students)

  • 김유정;유하나;박미정
    • 한국산학기술학회논문지
    • /
    • 제17권10호
    • /
    • pp.261-270
    • /
    • 2016
  • 본 연구는 간호대학생의 전공선택동기가 전공만족도, 대학생활만족도 및 자기주도 학습능력에 미치는 영향력을 확인하기 위해 시행된 서술적 조사연구이다. 본 연구에서는 자가보고식 설문지를 이용하여 2015년 4월 1일부터 15일까지 195명의 간호대학생으로부터 자료를 수집하였으며, Fisher's exact test, t-test, one way ANOVA, Mann Whitney test와 ANCOVA를 이용하여 자료를 분석하였다. 연구 결과 단지 41.5%의 간호대학생 만이 적성 또는 흥미를 이유로 간호학을 선택하였으며, 과반수인 58.5%의 간호대학생이 취업 전망과 고등학교 성적을 이유로 간호학을 선택하였다. 그리고 전공선택동기는 전공만족도(p<.001), 대학생활만족도(p=.008), 자기주도 학습능력(p=.001)에 유의한 영향요인으로 작용하였는데, 적성 또는 흥미로 전공을 선택한 그룹이 취업 전망으로 전공을 선택한 그룹보다 전공만족도 0.25배, 대학생활만족도 0.52배, 자기주도 학습능력 0.26배 높게 나타났다. 본 연구 결과를 바탕으로, 대학 입학 전 중고등학생들의 진로 지도를 위한 보다 전문적인 진로교육프로그램 개발 및 활용과 대학 입학 후 간호대학생의 대학생활 적응을 돕기 위한 전공선택동기에 따른 맞춤형 개별 상담프로그램 및 대학생활 적응 프로그램을 개발 및 적용을 제언하는 바이다.

한국어 화행 분류를 위한 최적의 자질 인식 및 조합의 비교 연구 (A Comparative Study on Optimal Feature Identification and Combination for Korean Dialogue Act Classification)

  • 김민정;박재현;김상범;임해창;이도길
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제35권11호
    • /
    • pp.681-691
    • /
    • 2008
  • 본 논문은 통계 기반 한국어 화행분류를 위하여 필요한 각 자질이 분류 성능에 미치는 영향과 성능 향상에 기여하는 자질 조합을 비교 평가한다. 지지벡터기계 학습 방법을 이용하여 구현한 화행 분류시스템을 통해 실험한 결과, n-gram 자질 중 품사 바이그램은 유용하지 않으며 형태소-품사 쌍과 다른 자질들을 결합했을 때 성능이 향상됨을 알 수 있었다. 또한, 자질 선택 기법을 사용한 자질 비율에 따른 실험을 통해서 매우 적은 자질만으로도 화행 분류에 있어 어느 정도 안정된 성능을 낼 수 있었다. 아울러, 실험 결과의 분석을 통해 한국어에서 마지막 어절이 문장 전체의 화행분류에 중요한 역할을 하며, 한국어의 특징인 자유 어순이나 주어의 빈번한 생략 등이 화행 분류 실험의 성능에 영향을 미친다는 사실도 알 수 있었다.

숙박비 지불수준에 따른 호텔선택요인 차이연구 (A Study on the Differences in Hotel Choice Factors according to the Payment Level of Accommodation Charge)

  • 남택영
    • 문화기술의 융합
    • /
    • 제6권3호
    • /
    • pp.33-43
    • /
    • 2020
  • 본 연구의 목적은 호텔이용고객을 대상으로 숙박비 지불수준을 조사하고, 지불수준(저가, 중가, 고가)에 따른 호텔선택요인의 차이를 분석하여 호텔 가격대별 고객유치를 위한 마케팅 방안을 제시하는데 있다. 연구목적을 달성하기 위해 2020년 2월 1일부터 2020년 4월 30일까지 호텔의 이용고객을 대상으로 설문조사를 실시했다. 총 350부의 설문지를 배포하여, 분석에 부적절한 45부를 제거하고, 최종적으로 305부의 설문지가 분석에 활용되었다. 분석결과, 집단 간에 가장 큰 차이를 보인 항목은 기본요인 중에서는 호텔크기, 조식메뉴, 레스토랑, 부대시설로 나타났다. 객실요인에서는 어메니티 부분이, 부대요인에서는 외부 관광 프로그램이 집단 간 차이가 있는 것으로 분석되었다. 핵심요인은 집단 간 차이를 보인 항목은 없었으나, 가장 중요한 요인으로 분석되었다. 이러한 내용을 바탕으로 마케팅 방안을 제안하면 다음과 같다. 저가 호텔은 고졸 학력의 20대 여성을 타겟으로, 저가형 가격정책과 프로모션을 하는 것이 효율적일 것이다. 중가 호텔은 대졸 학력의 40대 남성을 타겟으로, 셔틀버스 운영, 객실가격 프로모션, 직원서비스교육 등에 힘써야한다. 고가호텔의 경우는 20대 고졸 여성을 타겟으로, 전반적인 서비스 강화, 직원교육, 바이럴 마케팅 등이 중요한 것으로 분석되었다.

VRIFA: LRBF 커널과 Nomogram을 이용한 예측 및 비선형 SVM 시각화도구 (VRIFA: A Prediction and Nonlinear SVM Visualization Tool using LRBF kernel and Nomogram)

  • 김성철;유환조
    • 한국멀티미디어학회논문지
    • /
    • 제13권5호
    • /
    • pp.722-729
    • /
    • 2010
  • 예측 문제를 해결하기 위한 데이타마이닝 기법은 다양한 분야에서 주목받고 있다. 이것에 대한 한 예로 컴퓨터-기반의 질병의 예측 혹은 진단은 CDSS(Clinical Decision support System)에서 가장 중요한 요소이기도 하다. 이러한 예측 문제를 해결하기 위해서 RBF커널 같은 비선형 커널을 사용한 SVM이 가장 널리 사용되고 있는데, 이는 비선형 SVM이 어떠한 다른 분류기법보다 정확한 성능을 보이기 때문이다. 하지만 비선형 SVM을 사용한 경우에는 모델내부를 시각화하는 일이 어려워서 예측결과에 대한 직관적인 이해가 힘들고, 의학 전문가들은 이러한 비선형 SVM의 사용을 기피하고 있는 실정이다. Nomogram은 SVM을 시각화하기 위해 제안된 기법이다. 하지만 이는 선형 SVM의 경우에만 사용이 가능하고. 이 문제를 해결하기 위해서 LRBF 커널이 제안된 바 있다. LRBF 커널은 기존의 RBF 커널을 사용한 SVM과 대등한 결과를 보이면서도 예측결과의 선형적 분석도 가능하게 한다. 본 논문에서는 노모그램(Nomogram)과 LRBF 커널을 사용한 SVM이 통합되어 있는 예측 툴 VRIFA를 제안한다. 이 툴은 사용자와 상호작용하며 비선형 SVM 모델의 내부구조를 데이타의 각 속성별로 보여주는 방법으로 사용자가 예측결과를 직관적으로 이해하도록 도와준다. VRIFA는 Nomogram기반의 피쳐선택(feature selection) 기능도 포함하고 있는데, 이 기능은 예측결과에 부정적인 영향을 끼치거나 중복된 연관성을 보이는 속성을 제거함으로써 모델의 정확도를 높이는 데 기여한다. 그리고 데이터에 포함된 클래스의 비율이 한 쪽으로 치우쳐져 있는 경우에는 ROC 곡선 넓이(AUC)를 예측결과를 평가하기 위한 측도로 사용할 수 있다. 이 툴은 컴퓨터-기반의 질병 예측 혹은 질병의 위험 요소 분석에 대해 연구하는 연구자들에게 유용하게 사용될 것으로 전망하는 바이다.

Distribution of HCV Genotypes in Chronic Korean HCV Patients

  • Lee, Kyung-Ok;Jeong, Su-Jin;Byun, Ji-Young;Shim, Ae-Sug;Seong, Hye-Soon;Kim, Kyung-Tae
    • 대한임상검사과학회지
    • /
    • 제39권1호
    • /
    • pp.49-55
    • /
    • 2007
  • HCV는 single stranded RNA 바이러스로서 감염 시에는 만성간염 및 간경화 간암으로 진행될 수 있는 가능성이 높다. HCV는 6종의 주된 genotype과 그에 따른 많은 종류의 subtype이 보고되고 있으며, 세계 각 지역별로 그 분포는 매우 다양하다. 여러 가지 HCV genotype 중에서 1b 형에 감염되었을 경우 간경화나 간암으로 진행할 가능성이 높으며 치료효과도 떨어진다는 보고가 있어, 최근 HCV 환자의 치료에 있어서 HCV 바이러스 정량검사와 함께 HCV genotyping 검사의 임상적 활용이 높아지고 있다. 본 연구에서는 PCR-direct sequencing을 이용한 HCV genotyping 검사방법을 이용하여, 한국인 만성 HCV 간염환자에서 HCV genotype의 분포를 조사하였다. 검체로는 232명의 한국인 만성간염환자의 혈청을 사용하였으며, HCV 5'UTR 영역에서 선택한 2쌍의 primer로 nested PCR을 실시하였다. 증폭된 PCR산물 (215 bps)은 2% agrose gel로 전기영동을 하고 sequencing을 실시한 후 GeneBank의 BLAST 프로그램을 사용하여 HCV genotype을 분석하였다. HCV genotyping을 실시한 232명에서 5종류의 genotype, HCV 1b, 2a, 2b, 2c, 3a, 이 발견되었으며, HCV genotype 4, 5, 6 은 검출되지 않았다. 발견된 HCV genotype 중에서 HCV 1b의 검출률이 53.9%로 가장 높았고, 다음은 HCV 2a가 35.8%로 높게 나타나, 위 두 가지 HCV genotype을 합하면 거의 90%였다. 다음으로 HCV genotype 2b가 3.9%, 3a가 3.4% 그리고 2c가 3.0%의 순서로 검출되었다. 본 결과는 한국인 만성 HCV간염 환자의 치료 및 예후관리에 참고가 될 것으로 사료된다. 또한 PCR-direct sequencing을 이용한 HCV genotyping 검사는 간편하고 분명하게 결과를 판독할 수 있어 임상실험실에서 유용하게 사용될 수 있을 것으로 판단된다.

  • PDF

이하선종양에 대한 임상적고찰 (Parotid Gland Tumors)

  • 박혁동;심윤상;오경균;이용식
    • 대한기관식도과학회:학술대회논문집
    • /
    • 대한기관식도과학회 1993년도 제27차 학술대회 초록집
    • /
    • pp.97-97
    • /
    • 1993
  • 타액선은 주타액선과 부타액선으로 구분되며 주타액선에 원발하는 종양중 80% 전후가 이하선종양이고 그중 약 20-40%가 악성으로 알려져 있다. 이하선종양은 병리조직학적으로 매우 다양한 양상을 보이며 그 성장이 비교적 느리다는 특성이 있다. 저자들은 1985년부터 1992년까지 원자력병원 이비인후과에서 치료를 받은 이하선종양 환자 101명의 임상상을 후향적 방법으로 분석하여 그 결과를 보고하는 바이다. 1)양성종양은 51례(50.1%)였으며 남여비는 1:2.2이었고 호발연령은 30대였다. 혼합종이 43례(84.3%)로 가장 많았으며 46례(90.1%)에서 천엽에만 존재하였다. 세침흡인세포검사의 정확도는 51.4%였고 전 환자가 수술을 받았으며 술후 합병증으로 일시적 안면신경마비 9례, 타액루 8례, Frey증후군이 4례에서 나타났으나 재발은 없었다. 2)악성종양은 50례(49.9%)였으며 남여비는 1.4: 1이었고 호발연령은 50대였다. 점액표피양암종이 21례(42.0%)로 가장 많았고 선암종 8례(16.0%), 악성혼합종 5례, 선양낭성암종 5례 등의 순이었다. 3)악성종양의 임상적병기는 II기 9례(18.0%), III기 17례(34.0%), IV기 24(48.0%)였으며 종양이 천엽에만 있었던 경우는 17례(34.0%)였고 66.0%에서 양엽에 존재하였다. 세침흡인세포검사의 정확도는 35.5%였고 치료방법은 수술, 수술 및 병합치료 45례, 방사선치료 3례, 항암화학요법 2례였다. 술후합병증으로 일시적 안면신경마비 9례, 영구적 마비 3례, 타액루 4례, Frey증후군이 3례에서 관찰되었다. 4)악성종양의 l8례(36.0%)에서 재발이 관찰되었으며 그 중 6례(33.3%)는 경부에서의 재발이었고 원격전이는 12례(66.7%)에서 발견되었다. 5)악성종양 전체의 5년 보험생존율은 79.3%였고 치료방법에 따른 생존율은 수술 및 방사선치료 88.2%, 수술 83.3%, 방사선치료 50.0%의 순이었다.각된다.다고 하였다. 따라서 본 연구에서는 성인 여성기성복의 치수적합성을 높이기위하여 출산 후 중년에 접어 들면서 체형이 변화되는 것을 고려하여 연령을 분류하고(18세-34세, 30세-51세), 각 연령 집단에 따른 체형을 각각 3가지로 분류하였다. 이에 따라 의복 생산시의 총손실을 줄이기위한 상의, 하의생산시 필요한 부위별 최적규격치 간격을 제시하였다.적인 기능으로 보여지는 것에 좁혀서 작업능력의 연령증가 변화에 대하여다원적 평가를 하는 것이 실제적이라고 할 수 있다. 따라서 본 연구에서는 인간이 가지고 있는 다수의 기능중에서 수지교 치성과 연령증가와의 관계를 조사한다. 만약 연령증가 만으로 수지교치성을 평가 할 수 없는 경우에는 어떠한 요인이 수지기민성의 변화에 영향을 미치는가를 검토한다.t list)에서 자동적으로 사건들의 순서가 결정되도록 확장하였으며, 설비 제어방식에 있어서도 FIFO, LIFO, 우선 순위 방식등을 선택할 수 있도록 확장하였다. SIMPLE는 자료구조 및 프로그램이 공개되어 있으므로 프로그래머가 원하는 기능을 쉽게 추가할 수 있는 장점도 있다. 아울러 SMPLE에서 새로이 추가된 자료구조와 함수 및 설비제어 방식등을 활용하여 실제 중형급 시스템에 대한 시뮬레이션 구현과 시스템 분석의 예를 보인다._3$", chain segment, with the activation energy of carriers from the shallow trap with 0.4[eV], in he amorphous regions.의 증발산율은 우기의 기상자료를 이용하여 구한 결과 0.05 - 0.10 mm/hr 의 범위로서 이로 인한 강우손실량은 큰 의미가 없음을 알았다.재발이 나타난 3례의 환자를 제외한 9례 (75%)에서는 현재까지 재발소견을 보이지 않고 있다. 이러한 결과는 다른 보고자들과 유사한 결과를 보이고 있지만 아직까지 증례가 많지 않기 때문에 생존율을 얻기에는 미흡한 점이 있으며, 향후

  • PDF