• 제목/요약/키워드: Text mining analysis

검색결과 1,208건 처리시간 0.025초

비정형 공사감리문서 정보와 이항 로지스틱 회귀분석을 이용한 건축 현장 비용성과 평가 프레임워크 개발 (Cost Performance Evaluation Framework through Analysis of Unstructured Construction Supervision Documents using Binomial Logistic Regression)

  • 김창원;송태근;이기석;유위성
    • 한국건축시공학회지
    • /
    • 제24권1호
    • /
    • pp.121-131
    • /
    • 2024
  • 공사감리문서는 프로젝트의 수행과정을 제3의 독립적인 위치에서 모니터링한 종합적인 점검의견이라는 주요한 비정형 정보를 제공할 수 있다. 이와 같은 비정형 정보는 최근 분석방법론의 고도화에 따라 다양한 시사점을 제공할 수 있는 유의미한 자료로 평가받고 있다. 이에 본 연구는 건축공사의 최종 감리보고서 내 비정형 데이터를 대상으로 다양한 방법론을 활용하여 비용성과를 평가할 수 있는 프레임워크를 제시하였다. 세부적으로는 텍스트마이닝과 사회연결망분석을 통해 감리보고서 내 주요 키워드들을 도출하고, 해당 데이터들을 이항 로지스틱 회귀분석을 통해 분석하여 비용성과를 평가하였다. 그 결과, 감리보고서 내 비정형 데이터를 이용하여 추정된 비용성과 예측 정확도는 약 73% 수준으로 높게 도출되었다. 본 연구의 결과는 향후 건설산업에서 발생되는 다양한 비정형 데이터의 분석을 위한 기초자료로 활용이 가능할 것으로 예상된다.

LDA 토픽 모델링 기법을 활용한 무용공연의 연구 동향 분석 (Trend Analysis of Dance Performance Research Using Keywords and Topic Modeling of LDA Techniques)

  • 시유
    • 산업융합연구
    • /
    • 제22권3호
    • /
    • pp.13-25
    • /
    • 2024
  • 본 연구는 빅데이터를 기반으로 국내에서 발표된 무용공연 관련 연구 주제를 탐색하고, 시대 흐름에 따라 변화하는 연구동향을 살펴본다. 토픽모델링 분석하여 도출한 결과는 다음과 같다. (1)무용공연 마케팅전략 및 발전방안 연구, (2)무용공연 공간 및 공연만족 재관람요인 연구, (3)무대환경이 무용공연의 대중성 활성화와 기여도 연구, (4)무용공연 현황 및 무용단 운영사례 융합 연구, (5)다양한 소셜미디어 활용한 무용공연 확정성 연구, (6)기술적용 무용공연 콘텐츠 방향 및 개발 연구 6개의 주요 토픽이 도출되었다. 이에 무용공연을 비롯해 무용 분야 관련 연구의 시기, 사회 변화에 따른 연구 트렌드와 주제를 파악하고, 연구자들의 변화 관심 주제의 주요 핵심어를 추출해 키워드를 분석하였으며 시기별 주요 키워드를 비교 분석하였다. 이에 다각화되고 융합되면서 신기술이 적용되는 최신 연구 동향에 대한 발전적 연구의 필요성을 고민하고 제시하였다.

생성형 AI에 관한 인식 및 집단간 차이 분석 (Analysis of Perceptions and Differences between Groups regarding Generative AI)

  • 노규성
    • 디지털융복합연구
    • /
    • 제22권1호
    • /
    • pp.15-21
    • /
    • 2024
  • 본 연구는 생성형 AI의 활용 및 사용자 그룹 간 차이에 대한 인식을 분석하고자 하는 목적으로 가지고 있다. 본 연구는 생성형 AI 사용자 그룹 간 차이에 대한 인식을 조사하여 각 사용자층에 대한 AI 활용 역량 증진을 위한 시사점을 도출하였다. 검증 결과, 연령별 집단 간에는 유의적인 차이가 없으며, 전문적 배경에 의한 집단 간에는 생성형 AI 활용 분야와 생성형 AI의 윤리적 관점에서 유의미한 차이를 보였다. 이로 인해 본 연구는 전문 분야에 따라 다른 AI 솔루션 제공 및 맞춤형 교육 훈련 필요성, 윤리적 고려에 대한 특별한 교육과 문화 형성 등에 대한 대안을 제시하였다. 또한 텍스트 마이닝 기법을 통해 연령대별, 전문 분야별로 다른 방식의 AI 활용 및 활용 역량 개발 교육 등을 제안하였다는 점에서 학술적 기여를 했다고 사료된다.

사전과 말뭉치를 이용한 한국어 단어 중의성 해소 (Korean Word Sense Disambiguation using Dictionary and Corpus)

  • 정한조;박병화
    • 지능정보연구
    • /
    • 제21권1호
    • /
    • pp.1-13
    • /
    • 2015
  • 빅데이터 및 오피니언 마이닝 분야가 대두됨에 따라 정보 검색/추출, 특히 비정형 데이터에서의 정보 검색/추출 기술의 중요성이 나날이 부각되어지고 있다. 또한 정보 검색 분야에서는 이용자의 의도에 맞는 결과를 제공할 수 있는 검색엔진의 성능향상을 위한 다양한 연구들이 진행되고 있다. 이러한 정보 검색/추출 분야에서 자연어처리 기술은 비정형 데이터 분석/처리 분야에서 중요한 기술이고, 자연어처리에 있어서 하나의 단어가 여러개의 모호한 의미를 가질 수 있는 단어 중의성 문제는 자연어처리의 성능을 향상시키기 위해 우선적으로 해결해야하는 문제점들의 하나이다. 본 연구는 단어 중의성 해소 방법에 사용될 수 있는 말뭉치를 많은 시간과 노력이 요구되는 수동적인 방법이 아닌, 사전들의 예제를 활용하여 자동적으로 생성할 수 있는 방법을 소개한다. 즉, 기존의 수동적인 방법으로 의미 태깅된 세종말뭉치에 표준국어대사전의 예제를 자동적으로 태깅하여 결합한 말뭉치를 사용한 단어 중의성 해소 방법을 소개한다. 표준국어대사전에서 단어 중의성 해소의 주요 대상인 전체 명사 (265,655개) 중에 중의성 해소의 대상이 되는 중의어 (29,868개)의 각 센스 (93,522개)와 연관된 속담, 용례 문장 (56,914개)들을 결합 말뭉치에 추가하였다. 품사 및 센스가 같이 태깅된 세종말뭉치의 약 79만개의 문장과 표준국어대사전의 약 5.7만개의 문장을 각각 또는 병합하여 교차검증을 사용하여 실험을 진행하였다. 실험 결과는 결합 말뭉치를 사용하였을 때 정확도와 재현율에 있어서 향상된 결과가 발견되었다. 본 연구의 결과는 인터넷 검색엔진 등의 검색결과의 성능향상과 오피니언 마이닝, 텍스트 마이닝과 관련한 자연어 분석/처리에 있어서 문장의 내용을 보다 명확히 파악하는데 도움을 줄 수 있을 것으로 기대되어진다.

산업별 지속가능경영 전략 고찰: ESG 보고서와 뉴스 기사를 중심으로 (A Study on Industry-specific Sustainability Strategy: Analyzing ESG Reports and News Articles)

  • 김원희;권영옥
    • 지능정보연구
    • /
    • 제29권3호
    • /
    • pp.287-316
    • /
    • 2023
  • 최근 전 세계적으로 기업의 환경(Environmental)·사회(Social)·지배구조(Governance)의 비재무적 요소를 고려한 지속가능경영이 필수적으로 요구되면서, 각 기업들은 이에 대응할 수 있는 전략적 방향 수립이 중요해지고 있다. 특히 기업이 속한 산업별로 상이한 ESG 이슈에 대한 이해를 바탕으로 산업과 개별 기업의 특성을 반영한 전략을 개발하고 추진할 수 있어야 할 것이다. 이에 본 연구에서는 금융, 제조, IT 분야별로 나누어 주요 국내 기업들의 ESG 보고서와 관련 뉴스 기사를 이용하여 산업별 ESG 동향과 활동을 비교 분석하였다. 키워드 빈도분석과 토픽 모델링을 활용한 분석 결과, 국내 ESG 선도 기업들의 지속가능경영 활동에서의 산업별 차이를 도출 할 수 있다. 금융 분야에서는 '고객 중심 경영'과 '기후 변화 대응', 제조 분야에서는 '지속가능한 공급망 관리'와 '탄소중립', IT 분야에서는 '기술혁신'과 '디지털 책임'이 강조되었다. ESG 요소별 우선 순위가 높은 활동의 예를 들면, 환경 측면에서는 '에너지 절감과 친환경 활동', 사회 측면에서는 '사회공헌과 상생', 지배구조 측면에서는 '이사회 독립성 강화와 리스크 관리' 등으로 나타났다. 더 나아가 산업별 각 ESG 요소의 핵심 이슈 뿐 아니라 ESG 보고서와 뉴스 기사의 내용 유사성 및 차별점도 확인하였다. 연구의 결과는 산업별 동향을 고려한 ESG 경영 전략 및 정책의 방향성을 제시하고 있으며 이는 산업별 ESG 평가체계 수립에도 도움이 될 것으로 기대한다.

안전신문고를 이용한 재난 예측 방법론 제안 (Research Suggestion for Disaster Prediction using Safety Report of Korea Government)

  • 이준;신진동;조상명;이상화
    • 한국방재안전학회논문집
    • /
    • 제12권4호
    • /
    • pp.15-26
    • /
    • 2019
  • 안전신문고는 2014년부터 운영되고 있으며, 2019년 7월까지 약 1백만 건의 누적신고건수가 존재한다. 본 연구에서는 정보화시대가 되고 있는 현 시점에서 약 116만 건이 넘은 안전신문고의 신고내용을 분석하여 국민의 소리와 관심이 과연 얼마나 힘이 있고 의미가 있는지 확인하고자 한다. 특히, 예측능력에 관심을 두고 있는데, 과연 안전신문고의 신고내용이 향후 일어날 수 있는 재난과 연관성이 있는지 확인하고자 하였다. 이를 위해 연구진은 안전신문고에 신고된 자료를 텍스트로 받아 자연어 분석 방법(Natural Language Processing)론에 의해 분석하였다. 이를 토대로 안전신문고 분석 기간 동안의 신문기사를 분석하여 안전신문고와 신문 기사 내용 간의 상관관계를 분석하였다. 그 결과 응답 및 확인 관련 보고서의 수가 증가함에 따라 몇 달 내 사고가 발생하였으며, 사회의 불안에 대해 사전에 보고된 안전문고의 내용을 분석하면 미래 재난 예측에 활용될 수 있을 것이라 판단된다.

토픽 모델링을 활용한 한국의 플랫폼정부 연구동향 분석 (A Study on the Research Trends on Domestic Platform Government using Topic Modeling)

  • 서병조;신선영
    • 정보화정책
    • /
    • 제24권3호
    • /
    • pp.3-26
    • /
    • 2017
  • 온라인에서 생성되는 비정형 데이터가 기하급수적으로 증가하고 있으며 이중에서도 텍스트 데이터에 대한 분석이 다양한 분야에서 이루어지고 있다. 본 연구는 국내 지능정보사회 대비를 위한 플랫폼 정부의 연구 동향을 규명하기 위하여 국내 논문DB인 디비피아(www.dbpia.co.kr)에서 플랫폼 정부를 주제로 한 학술논문들의 제목과 연도, 학회, 초록 정보를 수집하였다. 본 연구에서 국내의 연구현황, 연구주제, 연구 분야 추이 등을 텍스트마이닝의 토픽 모델링 기법을 활용하여 분석하였다. 지능정보사회 대비를 위한 플랫폼 정부 전반적인 분야에 대해 기존 연구결과를 바탕으로 국내 국가정보화 추진 단계별 플랫폼 정부 관련 논문에서 기술, 서비스, 거버넌스로 잠재된 토픽을 추출하고, 연도별로 핵심 토픽의 추이를 분석하였다. 본 연구는 지능정보시대를 맞아 민간이 혁신을 주도하고 정부는 조력자 또는 촉진자 역할을 통해 국가사회 혁신이 이뤄질 수 있는 장을 조성해야 한다는 플랫폼 정부라는 정부의 새로운 역할에 대한 근거를 제시하였다는 데 의의를 지닌다. 플랫폼 정부의 국내연구 현황에 대한 객관적인 분석을 통해 플랫폼 정부 연구의 현주소를 이해하고 향후 발전방향을 모색함으로써, 향후 연구에 기여하는 참고자료를 제공할 수 있을 것으로 기대된다.

추천시스템관련 학술논문 분석 및 분류 (A Literature Review and Classification of Recommender Systems on Academic Journals)

  • 박득희;김혜경;최일영;김재경
    • 지능정보연구
    • /
    • 제17권1호
    • /
    • pp.139-152
    • /
    • 2011
  • 1990년대 중반에 협업 필터링의 출현으로 인하여 추천시스템에 관련된 연구가 늘어나게 되었다. 협업 필터링의 출현 이후 내용 기반 필터링, 협업 필터링과 내용 기반 필터링이 혼합된 하이브리드 필터링 등 새로운 기법들이 출현함으로써 2000년대에는 추천시스템의 연구가 눈에 띄게 증가하였다. 하지만 현재까지 추천시스템에 관련된 문헌들에 대한 리뷰와 분류가 체계적으로 되어있지 않다. 이와 같은 문제에 대한 해결방안으로써, 본 연구에서는 2001년부터 2010년도까지의 추천시스템에 관련된 문헌들 중 MIS Journal Ranking의 125개의 저널에서 추천시스템(Recommender system, Recommendation system), 협업 필터링(Collaborative Filtering), 내용 기반 필터링(Content based Filtering), 개인화 시스템(Personalized system) 등의 5가지 키워드로 제한하여 조사하였다. 총 37개의 저널에서 논문을 검색하였으며, 검색되어진 논문을 분석한 결과 추천시스템과 관련이 없는 논문을 제외한 총 187개의 논문을 선정하여 분석하였다. 이 연구에서는 그러나 컨퍼런스 논문, 석사, 박사학위 논문, 영어로 작성되지 않은 논문, 완성되지 않은 논문 등은 제외하였다. 본 연구에서는 187개의 논문을 분석하여 2001년부터 2010년까지의 각각의 년도 별 추천시스템의 연구에 대한 동향 분석, Journal별 추천시스템의 게재 분류, 추천시스템 어플리케이션의 사용 분야(책, 문서, 이미지, 영화, 음악, 쇼핑, TV 프로그램, 기타)별 분류 및 분석, 추천시스템에 사용된 데이터마이닝 기술(연관 규칙, 군집화, 의사 결정나무, 최근접 이웃 기법, 링크 분석 기법, 신경망, 회귀분석, 휴리스틱 기법)별 분류 및 분석을 수행하였다. 따라서 본 연구에서 제안한 각각의 분류 및 분석 결과들을 통하여 현재까지 추천시스템의 연구에 대한 연구 동향을 파악 할 수 있었으며, 분석결과를 통해 추천시스템에 관심이 있는 연구자와 전문가에게 미래의 추천시스템의 연구에 대한 가이드라인을 제시 할 수 있을 것이라고 기대한다.

산지하천을 대상으로 한 국내 연구동향 분석: 국제 연구동향과의 비교 (Analysis of Research Trends on Mountain Streams in the Republic of Korea: Comparison to International Research Trends)

  • 이상인;서정일;이요한;김석우;전근우
    • 한국환경생태학회지
    • /
    • 제33권2호
    • /
    • pp.216-227
    • /
    • 2019
  • 이 연구에서는 우리나라의 자연환경 조건 및 사회적 요구를 반영한 산지하천의 합리적 관리방안을 제시하기 위한 연구의 일환으로 산지하천을 대상으로 한 국제 국내 연구논문을 수집 및 분석한 후, VOSviewer 프로그램을 이용한 텍스트마이닝과 동시출현단어 분석을 통하여 연구주제에 따른 연구영역을 구별하였으며, 이후 각 연구영역별로 시 공간적인 연구동향을 비교하였다. 그 결과, 산지하천을 대상으로 한 국내 연구논문은 국제 연구논문에 비하여 초보적인 단계에 있음을 확인할 수 있었다. 즉, 국제 연구논문은 산지하천의 어류 및 무척추동물의 서식환경과 종구성에 관한 연구영역(제1연구영역), 산지하천에서의 수문현상 및 양분이동에 관한 연구영역(제2연구영역), 산지하천에서의 유수에 의한 하상물질 이동 및 지형 변화에 관한 연구영역(제3연구영역), 산지하천 주변의 식물종 구성에 관한 연구영역(제4연구영역)으로 구분되었다. 이 중 제1연구영역과 관련된 국내 연구논문은 주로 대형무척추동물만을 연구소재로 하고 있었으며, 제3연구영역과 관련된 국내 연구논문은 유수에 의한 하상물질 이동 및 지형 변화를 생태계의 교란작용이 아닌 산지토사재해의 원인으로 간주하고 있다는 것을 알 수 있었다. 이렇게 구분된 각 연구영역이 전체 연구논문 중에서 점유하고 있는 비율을 시기별 국가별로 파악한 결과, 국제 연구논문의 경우 3 4연구영역에 해당하는 연구논문이 증가하는 것으로 나타났으며, 여기에는 미국을 중심으로 브라질 캐나다 중국의 영향이 크게 작용하였다. 이와 달리 국내 연구논문의 경우 1 3연구영역에 해당하는 연구논문이 시간의 경과에 따라 다소 증가하였으나, 이 두 연구영역 간 상호 연관성은 다소 부족한 것으로 나타났다. 따라서 향후에는 이를 보완한 하이브리드 성격의 연구가 필요할 것으로 사료된다.

패션 트렌드의 주기적 순환성에 관한 빅데이터 융합 분석 (The Analysis of Fashion Trend Cycle using Big Data)

  • 김기현;변혜원
    • 한국융합학회논문지
    • /
    • 제11권12호
    • /
    • pp.113-123
    • /
    • 2020
  • 본 논문은 과거와 현재의 패션 트렌드와 패션 유행 주기에 관한 빅데이터 분석을 실시하였다. 패션 전문가나 패션쇼가 아닌 일반 사람들의 데일리룩을 위한 패션 트렌드를 분석하는데 집중하였다. 소셜 매트릭스 도구인 텍스톰을 활용하여 빈도수 분석, N-gram 분석, 네트워크 분석 및 구조적 등위성 분석을 수행하였다. 분석 결과, 첫째, 패션 전문가가 아닌 일반 사람들의 데일리 룩을 대상으로 과거(1980년대, 1990년대)와 현재(2019년, 2020년)의 패션 키워드를 도출하였다. 둘째, 과거의 패션이 현재의 패션으로 재현되는 순환성과 순환 주기가 30-40년 정도로 짧아졌음을 빅데이터 분석을 통해 과학적으로 검증하였다. 셋째, 도출된 패션 키워드들의 구조적 등위성 분석을 수행한 결과, 과거 패션에서는 청바지 패션, 레트로 코디, 애슬레저룩, 연예인 복고패션의 4개의 군집으로, 현재 패션에서는 레트로 청바지, 뉴트로, 레이디 쉬크, 레트로 퓨처리즘의 4개의 군집을 확인하였다. 넷째, 과거의 패션이 현재의 패션으로 재현되고 진화하는 네트워크 연결 관계를 확인하고 그 배경에 관한 이슈를 고찰하였다. 이와 같은 연구결과는 과거와 현재의 패션 키워드를 도출하고 이로부터 패션 유행의 순환 주기를 확인함으로써 과거를 통해 미래 패션을 예측하도록 하는데 의의가 있다.