• 제목/요약/키워드: Group Model Clustering

검색결과 99건 처리시간 0.031초

도홍사물탕(桃紅四物湯)이 광화학적 뇌경색 마우스의 유전자 발현에 미치는 영향 (Effects of Dohongsamul-Tang on the Gene Expression of Photothrombotic Ischemia Mouse Model)

  • 조권일;김혜윤;고석재;이성근;신선호;문병순
    • 동의생리병리학회지
    • /
    • 제23권3호
    • /
    • pp.645-661
    • /
    • 2009
  • The water extract of Dohongsamul-Tang(DHSMT) has been traditionally used to stroke and brain injuries in Oriental Medicine. The present study was designed to investigate the effects of DHSMT on the gene expression profile of cerebral infarction by cDNA microarray in photothrombotic ischemia mouse model. Photothrombotic ischemia was induced in stereotactically held male BALB/c mice using rose bengal and cold light. MRI was performed 24 hours after inducing photothrombosis using 1.5 T MRI and 47 mm surface coil to obtain T2-weighted, and contrast-enhanced images. After MRI test, animal was sacrificed and the brain sections were stained for hematoxylin and eosin and immunohistochemistry. MRI and histological analysis revealed that lesion of thrombotic ischemia was well induced in the cortex with the evidence of biological courses of infarction. The target area of thrombotic infarction was 1 mm anterior to bregma and 3 mm lateral to midline with 2 mm in diameter, which were decreased by administration of DHSMT. To assess gene expression pattern of cerebral infarction, mRNA was isolated and reacted with microarray chip(Agilant's DNA Microarray 44K). Scatter and MA plot analysis were performed to clustering of each functional genes. M value [M=log2(R/G), A={log2(R ${\times}$ G)}/2] was between -0.5 and +0.5 with 40% difference. After pretreatment with DHSMT, the expression levels of mRNA of many genes involved in various signaling pathway such as apoptosis, cell cycle, cell proliferation, response to oxidative stress, immune response, angiogenesis, and inflammatory cytokine were markedly inhibited in photothrombotic ischemia lesion compared to the control group. These results suggest that DHSMT prevent ischemic death of brain on photothrombotic ischemia model of mice through modulation of gene expression at the transcriptional level.

소년범죄자의 사회심리적 성격특성 (Social Psychological Characteristics of Juvenile Offenders)

  • 고제원
    • 한국콘텐츠학회논문지
    • /
    • 제21권10호
    • /
    • pp.702-711
    • /
    • 2021
  • 본 연구는 형사입건된 소년범죄자들을 대상으로 PAI 프로파일 유형을 살피기 위해 2018-2020년 입건된 청소년 251명과 일반청소년 173명을 대상으로 성격유형과 행동특성을 알아보고자 하였다. 소년범죄자들과 일반청소년들의 전체 프로파일을 살펴보면 저빈도(INF), 조증(MAN), 반사회적 특징(ANT), 알코올 문제(ALC), 약물문제(DRG), 공격성(AGG)이, 지배성(DOM)과 온정성(WRM)에서 차이가 나타났다. 이러한 결과를 바탕으로 평균 5점이상의 차이가 난 반사회적 특징(ANT), 공격성(AGG), 지배성(DOM)을 요인으로 군집분석을 실시하여 일반청소년 비율이 높은 군집 1과 소년범죄자 비율이 높은 군집 2로 분류되었으며 군집 1은 일반청소년의 프로파일과 유사한 모형을 보여 방어집단으로 명명하였으며 군집 2의 프로파일 유형은 외현화 집단으로 나타낼 수 있는 외현화로 명명하였다. 이 결과들은 기존 연구결과와 유사하였으며 소년 범죄자들의 프로파일 유형은 일반청소년들보다 임상척도가 전반적으로 높아 행동상 문제점이 있는 것으로 나타났다. 소년범죄자에 관한 연구가 지속적으로 이루어진다면 소년범죄자 뿐만 아니라 청소년들에 대한 이해도 이루어질 수 있을 것이다.

온톨로지 기반 영화 메타데이터간 연관성을 활용한 영화 추천 기법 (The Ontology Based, the Movie Contents Recommendation Scheme, Using Relations of Movie Metadata)

  • 김재영;이석원
    • 지능정보연구
    • /
    • 제19권3호
    • /
    • pp.25-44
    • /
    • 2013
  • 최근 IPTV와 스마트 TV 등의 등장과 영상 콘텐츠를 시청하고 검색할 수 있는 웹 서비스의 등장으로 영상 콘텐츠의 접근이 용이해져 사용자들은 자신이 원하는 콘텐츠를 찾고자 하는 요구가 증가하고 있다. 하지만 서비스되는 콘텐츠의 양이 방대하여 영상 콘텐츠를 검색할 때 사용하는 키워드 기반의 검색은 많은 양의 결과를 가져오며 사용자가 필요로 하지 않은 결과가 검색된다. 따라서 사용자가 원하는 콘텐츠의 검색 시간과 노력이 증가 하게 되었다. 이를 극복 하기 위해 콘텐츠 추천 및 검색에 대한 연구가 수행되어 왔다. 기존의 연구에는 사용자의 선호도 분석을 통하여 영상 콘텐츠를 추천하거나 비슷한 성향을 가지는 사용자들을 분류하여 콘텐츠를 추천하는 기법들이 연구되어 왔다. 본 논문에서는 영상 콘텐츠 중 영화의 추천을 위해 사용자 개인의 영화 메타데이터의 선호도를 분석하고, 영화의 메타데이터와 영화의 유사성을 도출하여 이를 기반으로 영화 추천 기법을 제안한다. 영화의 특징을 담고 있고, 사용자의 영화 선호도에 영향을 끼치는 장르, 줄거리, 배우, 키워드 등의 영화 메타데이터를 기반으로 온톨로지를 구축하고, 확률 기법을 통한 메타 데이터간의 유사성을 분석하여 유사 메타데이터를 연결한다. 또한 사용자의 선호도와 그룹을 정의하고, 사용자 정보를 활용하기 위한 사용자 모델을 정의한다. 제안하는 추천 기법은 1) 사용자 정보기반의 후보 영화 검색 컴포넌트, 2) 사용자 선호기반의 후보 영화 검색 컴포넌트, 3) 1)과 2)의 결과를 통합하고 가중치를 부여하는 컴포넌트, 4) 최종결과의 분석을 통한 개인화된 영화 추천 컴포넌트 등 총 4가지 컴포넌트로 구성된다. 제안하는 추천 기법의 실험을 위하여 20대 남/녀 10명씩 20명을 대상으로 실험을 진행하였으며, 실험결과 평균 Top-5에서 2.1개 Top-10에서 3.35개 Top-20에서 6.35의 영화가 보고 싶은 영화로 선택되었다. 본 논문에서는 영화 메타데이터간의 연관성 도출을 통하여 영화간의 유사성을 도출하고 이를 기반으로 사용자의 기본적인 정보를 활용한 추천뿐만 아니라 사용자가 예상하지 못한 영화의 추천이 가능하다.

Word2Vec을 활용한 제품군별 시장규모 추정 방법에 관한 연구 (A Study on Market Size Estimation Method by Product Group Using Word2Vec Algorithm)

  • 정예림;김지희;유형선
    • 지능정보연구
    • /
    • 제26권1호
    • /
    • pp.1-21
    • /
    • 2020
  • 인공지능 기술의 급속한 발전과 함께 빅데이터의 상당 부분을 차지하는 비정형 텍스트 데이터로부터 의미있는 정보를 추출하기 위한 다양한 연구들이 활발히 진행되고 있다. 비즈니스 인텔리전스 분야에서도 새로운 시장기회를 발굴하거나 기술사업화 주체의 합리적 의사결정을 돕기 위한 많은 연구들이 이뤄져 왔다. 본 연구에서는 기업의 성공적인 사업 추진을 위해 핵심적인 정보 중의 하나인 시장규모 정보를 도출함에 있어 기존에 제공되던 범위보다 세부적인 수준의 제품군별 시장규모 추정이 가능하고 자동화된 방법론을 제안하고자 한다. 이를 위해 신경망 기반의 시멘틱 단어 임베딩 모델인 Word2Vec 알고리즘을 적용하여 개별 기업의 생산제품에 대한 텍스트 데이터를 벡터 공간으로 임베딩하고, 제품명 간 코사인 거리(유사도)를 계산함으로써 특정한 제품명과 유사한 제품들을 추출한 뒤, 이들의 매출액 정보를 연산하여 자동으로 해당 제품군의 시장규모를 산출하는 알고리즘을 구현하였다. 실험 데이터로서 통계청의 경제총조사 마이크로데이터(약 34만 5천 건)를 이용하여 제품명 텍스트 데이터를 벡터화 하고, 한국표준산업분류 해설서의 산업분류 색인어를 기준으로 활용하여 코사인 거리 기반으로 유사한 제품명을 추출하였다. 이후 개별 기업의 제품 데이터에 연결된 매출액 정보를 기초로 추출된 제품들의 매출액을 합산함으로써 11,654개의 상세한 제품군별 시장규모를 추정하였다. 성능 검증을 위해 실제 집계된 통계청의 품목별 시장규모 수치와 비교한 결과 피어슨 상관계수가 0.513 수준으로 나타났다. 본 연구에서 제시한 모형은 의미 기반 임베딩 모델의 정확성 향상 및 제품군 추출 방식의 개선이 필요하나, 표본조사 또는 다수의 가정을 기반으로 하는 전통적인 시장규모 추정 방법의 한계를 뛰어넘어 텍스트 마이닝 및 기계학습 기법을 최초로 적용하여 시장규모 추정 방식을 지능화하였다는 점, 시장규모 산출범위를 사용 목적에 따라 쉽고 빠르게 조절할 수 있다는 점, 이를 통해 다양한 분야에서 수요가 높은 세부적인 제품군별 시장정보 도출이 가능하여 실무적인 활용성이 높다는 점에서 의의가 있다.

일개 종합병원의 민간 건강검진 수검자의 검진이용 특성, 건강행태 및 건강관리 수준 분석 (Analysis of Utilization Characteristics, Health Behaviors and Health Management Level of Participants in Private Health Examination in a General Hospital)

  • 김유미;박종호;김원중
    • 한국산학기술학회논문지
    • /
    • 제14권1호
    • /
    • pp.301-311
    • /
    • 2013
  • 본 연구의 목적은 2차 종합병원급 건강검진센터를 이용한 민간 종합검진 환자의 검진 이용특성과 이들의 건강행태 및 건강관리 수준을 분석하는 것이다. 이를 위해 대전지역 일개 2차 종합병원급 건강검진센터의 2011년 20,696명의 민간 건강검진 수검자를 대상으로 이들의 2001년에서 2011년까지 11년간의 수검자료 150,501건을 분석하였다. 민간 종합검진 수검자의 검진군 분류를 위한 군집분석은 K-means기법의 z-score표준화 방법을 이용하여 분류하였으며, 정기/비정기 검진 분류모형 개발을 위해 로지스틱회귀분석, 의사결정나무, 신경망 분석을 이용하였다. 개발된 비정기 검진군 분류 모형에 따라 신규 검진군 중 비정기 검진군이 될 확률이 높은 1,000명을 추출하여 고객관리사업 대상자로 하였다. 분석결과, 수검자는 신규 검진군, 정기 검진군, 비정기 검진군으로 분류하였다. 신규 검진군은 30대가 많고, 신장질환 의심자의 비율이 높았다. 정기 검진군은 남자, 이상지혈증 의심 비율이 높았다. 비정기 검진군은 흡연율과 운동부족 비율이 높았고, 빈혈 및 당뇨의심 비율이 높았다. 의사결정나무 분석결과 비정기 검진환자의 특성에 영향을 미치는 변수로는 성별, 연령, 거주지, 운동, 빈혈, 이상지혈증, 당뇨, 비만, 간질환 등이었다. 특히 여자 수검자로서 빈혈 검사는 정상, 운동을 하지 않는 군이면서 비만이 의심되는 수검자의 비정기적 수검율은 71.4%에 달하였다. 이러한 연구결과 토대로 맞춤형 고객관리 사업을 진행한다면 건강검진센터 효율적인 운영에 기여할 수 있을 것이다.

벼 미숙종자의 발현유전자 구조특성분석 (Structural analysis of expressed sequence tags inimmature seed of Oryza sativa L.)

  • 윤웅한;이강섭;이정숙;한장호;김창국;;;김진아;이정화;이태호;김용환
    • Journal of Plant Biotechnology
    • /
    • 제36권2호
    • /
    • pp.130-136
    • /
    • 2009
  • Rice (Oryza sativa) is the most important staple crop in Korea. With its small genome size of 389Mb, rice is a model plant for genome research. We analyzed expressed sequence tag (EST) clones from immature seeds of rice (cv. Ilpum) at 20 days after heading. The 25,668 EST clones were clustered by using SeqMan program and 7,509 clones were selected as unique clones. We compared the 7,509 unique genes with KOME database including the 32,127 FL-cDNA in rice. Finally, 4,990 clones were homologous and 2,519 clones non-homologous to FL-cDNA clones. In addition, we mapped the 7,509 cDNA clones by using TIGR rice pseudomolecule version 5. Ultimately, 7,347 clones were matched to be significant clones related to the TIGR rice pseudomolecules, but 162 clones were unmapped. For the clustering of orthologous group genes, we further analyzed the 7,509 EST clones from immature seeds using NCBI clusters of orthologous groups database. Among the clones, 4,968 clones were categorized into information storage and processing, cellular processes and signaling, metabolism and poorly characterized genes, proportioning 799 (14.89%), 1,536 (28.3%), 1,148 (21.2%) and 1,936 (35.7%) clones to the previous four categories, respectively.

IT프로젝트 위험 요인 식별 및 분석 프레임워크 연구 (A Framework for Identifying and Analyzing IT Project Risk Factors)

  • 최장호;곽찬희;이희석
    • 경영정보학연구
    • /
    • 제19권4호
    • /
    • pp.87-110
    • /
    • 2017
  • IT프로젝트 관리에 가장 중요한 요소 중 하나는 위험 관리이다. IT프로젝트 수행 중 발생할 수 있는 위험을 예측하고 대처하는 것이 프로젝트 성공 여부를 결정짓는 중요한 요소로 작용하기에, IT프로젝트 위험 요인은 학계와 업계에서 꾸준히 주목을 받는 주제이다. 이에 연구자들은 우선순위를 포함한 위험 요인 체크리스트 도출, 위험 요인들의 원인 관계 분석 및 프로젝트에 미치는 영향도 도출 등의 연구를 수행하였다. 그러나 위험 요인의 발생 확률과 영향도를 동시에 고려하는 위험 노출도의 관점에서 IT프로젝트 위험 요인을 체계적으로 분류한 연구는 미비하다. 본 연구는 문헌 연구 및 IT프로젝트 전문가 인터뷰를 바탕으로 IT프로젝트 위험 요인 53개를 도출하고, 도출된 위험 요인을 위험 노출도 관점에서 조사하였다. 나아가 프로젝트 관리자 140명의 설문을 통해 얻은 데이터로 군집분석을 실시해 4영역(HIHF, HILF, LIHF, LILF)으로 구분된 IT프로젝트 위험 요인 분류체계 프레임워크를 개발하였다. 또한 IT프로젝트를 프로젝트 성격 및 분야별로 위험 요인의 노출도 및 우선순위를 비교 분석하였다. 본 연구의 결과는 IT프로젝트 관리자들의 효율적 위험 관리 전략 수립을 돕고 IT프로젝트 실패를 줄이는데 활용될 수 있을 것이다. 또한 위험 요인의 발생 확률과 영향도를 동시에 고려했다는 측면에서 학문적인 의의를 가진다.

협업 필터링 및 하이브리드 필터링을 이용한 동종 브랜드 판매 매장간(間) 취급 SKU 추천 시스템 (SKU recommender system for retail stores that carry identical brands using collaborative filtering and hybrid filtering)

  • 조용민;남기환
    • 지능정보연구
    • /
    • 제23권4호
    • /
    • pp.77-110
    • /
    • 2017
  • 최근 인터넷 기반의 웹 및 모바일 기기를 통한 소비 패턴의 다양화와 개성화가 급진전됨에 따라 전통적 유통채널인 오프라인 매장의 효율적 운영이 더욱 중요해졌다. 매장의 매출과 수익 모두를 제고하기 위해 매장은 소비자에게 가장 매력적인 상품을 적시에 공급-판매 해야 하는데 많은 상품들 중에서 어떤 SKU를 취급하는 것이 판매 확률을 높이고 재고 비용을 낮출 수 있는지에 대한 연구가 부족한 실정이다. 특히, 여러 지역에 걸쳐 다수의 오프라인 매장을 통해 상품을 판매하는 기업의 경우 고객에게 매력적인 적절한 SKU를 추천 받아 취급할 수 있다면 매장의 매출 및 수익률 제고에 도움이 될 것이다. 본 연구에서는 개인화 추천에 이용되어 왔던 협업 필터링과 하이브리드 필터링 등의 추천 시스템(Recommender System)을 국가별, 지역별로 복수의 판매 매장을 통해 동종 브랜드를 취급하는 유통 기업의 매장 단위 취급 SKU 추천 방식을 제안하였다. 각 매장의 취급 품목별 구매 데이터를 활용하여 각 매장 별 유사성(Similarity)을 계산하고 각 매장의 SKU별 판매 이력에 따라 협업 필터링을 하여 최종적으로 매장에 개별 SKU를 추천하였다. 또한 매장 프로파일 데이터를 활용하여 주변수 분석 (PCA : Principal Component Analysis) 및 군집 분석(Clustering)을 통하여 매장을 4개의 군집으로 분류한 뒤 각 군집 내에서 협업 필터링을 적용한 하이브리드 필터링 방식으로 추천 시스템을 구현하고 실제 판매 데이터를 바탕으로 두 방식의 성능을 측정하였다. 현존하는 대부분의 추천 시스템은 사용자에게 영화, 음악 등의 아이템을 추천하는 방식으로 연구가 진행되어 왔고 실제로 산업계에서의 적용 또한 개인화 추천 시스템이 주류를 이루고 있다. 그 동안 개인화 서비스 영역에서 주로 다루어져 왔던 이러한 추천 시스템을 동종 브랜드를 취급하는 유통 기업의 매장 단위에 적용하여 각 매장의 취급 SKU를 추천하는 방식에 대한 연구는 거의 이루어지지 않고 있는 실정이다. 기존 추천 방법론의 추천 적용 대상이 '개인의 영역이었다면 본 연구에서는 국가별, 지역별로 복수의 판매 매장을 통해 개인의 영역을 넘어 매장의 영역으로 확대하여 동종 브랜드를 취급하는 유통 기업의 매장 단위 취급 SKU 추천 방식을 제안하고 있다. 또한 기존의 추천시스템은 온라인에 한정되었다면 이를 오프라인으로 활용 범위를 넓히고, 기존 개인을 기반으로 분석을 하는 것보다 매장영역으로 확대 적용하기에 적합한 알고리즘을 개발하기 위해 데이터마이닝 기법을 적용하여 추천 방법을 제안한다. 본 연구의 결과가 갖는 의의는 개인화 추천 알고리즘을 동일 브랜드를 취급하는 복수의 판매 매장에 적용하여 의미 있는 결과를 도출하고 실제 기업을 대상으로 시스템으로 구축하여 활용할 수 있는 구체적 방법론을 제시했다는 데에 있다. 개인화 영역을 위주로 이루어졌던 기존의 추천 시스템과 관련한 학계의 연구 영역을 동종 브랜드를 취급하는 기업의 판매 매장으로 확장시킨 첫 시도라는 데에도 의미가 있다. 2014년 03주차 ~ 05주차 전(全) 매장 판매 수량 실적 Top 100개 SKU로 추천의 대상을 한정하여 협업 필터링과 하이브리드 필터링 방식으로 52개 매장 별로 취급 SKU를 추천하고, 추천 받은 SKU에 대한 2014년 06주차 매장별 판매 실적을 집계하여 두 추천 방식의 성과를 비교하였다. 두 추천 방식을 비교한 이유는 본 연구의 추천 방법이 기존 추천 방식 보다 높은 성과를 입증하기 위해 단순히 오프라인에 협업필터링을 적용한 것을 기준 모델로 정의하였다. 이 기준 모델에 오프라인 매장 관점의 특성을 잘 반영한 본 연구 모델인 하이브리드 필터링 방법과 비교 함으로써 성과를 입증한다. 연구에서 제안한 방식은 기존 추천 방식보다 높은 성과를 나타냈으며, 이는 국내 대기업 의류업체의 실제 판매데이터를 활용하여 입증하였다. 본 연구는 개인 수준의 추천시스템을 그룹수준으로 확장하여 효율적으로 접근하는 방법을 이론적인 프레임 워크를 만들었을 뿐 아니라 실제 데이터를 기반으로 분석하여 봄으로써 실제 기업들이 적용해 볼 수 있다는 점에서 연구의 가치가 크다.

교통사고 데이터의 마이닝을 위한 연관규칙 학습기법과 서브그룹 발견기법의 비교 (Comparison of Association Rule Learning and Subgroup Discovery for Mining Traffic Accident Data)

  • 김정민;류광렬
    • 지능정보연구
    • /
    • 제21권4호
    • /
    • pp.1-16
    • /
    • 2015
  • 교통사고의 원인을 규명하고 미래의 사고를 방지하기 위한 노력의 일환으로 데이터 마이닝 기법을 이용한 교통 데이터 분석의 연구가 이루어지고 있다. 하지만 기존의 교통 데이터를 이용한 마이닝 연구들은 학습된 결과를 사람이 이해하기 어려워 분석에 많은 노력이 필요하다는 문제가 있었다. 본 논문에서는 많은 속성들로 표현된 교통사고 데이터로부터 유용한 패턴을 발견하기 위해 규칙 학습 기반의 데이터 마이닝 기법인 연관규칙 학습기법과 서브그룹 발견기법을 적용하였다. 연관규칙 학습기법은 비지도 학습 기법의 하나로 데이터 내에서 동시에 많이 등장하는 아이템(item)들을 찾아 규칙의 형태로 가공해 주며, 서브그룹 발견기법은 사용자가 지정한 대상 속성이 결론부에 나타나는 규칙을 학습하는 지도학습 기반 기법으로 일반성과 흥미도가 높은 규칙을 학습한다. 규칙 학습 시 사용자의 의도를 반영하기 위해서는 하나 이상의 관심 속성들을 조합한 합성 속성을 만들어 규칙을 학습할 수 있다. 규칙이 도출되고 나면 후처리 과정을 통해 중복된 규칙을 제거하고 유사한 규칙을 일반화하여 규칙들을 더 단순하고 이해하기 쉬운 형태로 가공한다. 교통사고 데이터를 대상으로 두 기법을 적용한 결과 대상 속성을 지정하지 않고 연관규칙 학습기법을 적용하는 경우 사용자가 쉽게 알기 어려운 속성 사이의 숨겨진 관계를 발견할 수 있었으며, 대상 속성을 지정하여 연관규칙 학습기법과 서브그룹 발견기법을 적용하는 경우 파라미터 조정에 많은 노력을 기울여야 하는 연관규칙 학습기법에 비해 서브그룹 발견기법이 흥미로운 규칙들을 더 쉽게 찾을 수 있음을 확인하였다.