• 제목/요약/키워드: web text analysis

검색결과 279건 처리시간 0.022초

URL 분석을 위한 웹 로봇 구현 및 성능분석 (Implementation and Performance Analysis of Web Robot for URL Analysis)

  • 김원;김희철;진용옥
    • 한국통신학회논문지
    • /
    • 제27권3C호
    • /
    • pp.226-233
    • /
    • 2002
  • This paper proposes the web robot based on Multi-Agent which the mutual dependency should be minimized each other with dividing the function each to collect Webpage. In result it is written to make a foundation for producing the effective statistics to analyze the domestic webpages and text, multimedia file composition ratio through performance analysis of the implemented system. It is easy that Web robot of the sequential processing method to collect Webpage on the same resource environment produces the limit of collecting performance. So to speak Webpages have "Dead-links" URL which is produced by the temporary host down and instability of network resource. If there are much "Dead-links" URL in the webpages, it takes a lot of time for web robot to collect HTML. The propose of this paper to be proposed, makes the maximum improvement to extract the webpages to process "Dead-links" URL on the Inactive URL scanner Agent.

멀티미디어를 활용한 의류학관련 교과목 콘텐츠의 개발 -의류소재 이해 및 분석- (Development of the Multimedia Contents for the Clothing & Textiles -Understanding h Analysis of Textile Materials-)

  • 이정순
    • 한국의류학회지
    • /
    • 제27권1호
    • /
    • pp.162-168
    • /
    • 2003
  • The purpose of this research is to develop the multimedia contents for the subject . is the subject to understand and analyze the characteristics of the textile materials and to be putting the key point to utilize the textile materials as the fashion materials. 1 developed the contents using multimedia system standing on the basis of Internet. The developed contents were organized to induce the interest. The sounds, pictures. computer graphics, animations, text, AOD and AOD etc. were utilized in these contents. These contents were consisted of preview, restudy, and the feedback through question. These contents can be executed directly in Web browser through Internet. Address is http://web.cnu.ac.kr/-fabric. Ⅰ applied this multimedia contents to actual class. It was utilized much more than textbook and it was turned out to be efficient in the experiment class. It was inspected that the most of students were satisfied with the utilizing these multimedia contents.

공간정보 공유체계를 위한 모듈기반 WebGIS 플랫폼 연구 (Module-based WebGIS platform for spatial information sharing system)

  • 신정석;최영락
    • 한국멀티미디어학회논문지
    • /
    • 제25권11호
    • /
    • pp.1557-1563
    • /
    • 2022
  • Currently Spatial Data is collected and processed in various methods, and its usability is very high. However, the existing Spatial Data analysis Software usually requires professional knowledge in the collection, refinement, and application of spatial Date, making it difficult to access and apply it. Therefore, this study established a new WebGIS platform with improved accessibility and usability to solve these problems. This platform supports various services such as master map sharing, spatial data generation, automatic coordinate system conversion, WMS issuance, grid generation, and grid analysis. These services increase operational convenience, such as simplifying repetitive tasks and automatically expressing text files. While it is believed that non-experts can easily and conveniently because of them to simplify and express the results. In addition, it is judged to have high accuracy and reliability compared to the analysis results using the existing Open Source-based GIS software.

인터넷을 통한 스페이스 프레임 구조 해석에 관한 연구 (A Study of Structural Analysis for Space Frame on the World Wide Web)

  • 석창목;남상관;박상훈;정환목;권영환
    • 한국공간구조학회논문집
    • /
    • 제1권1호
    • /
    • pp.135-142
    • /
    • 2001
  • This paper proposes structural analysis on the World Wide Web to form a part of the architectural design project. It purposes modeling space frames and a structural analysis program on the internet only by inputting basic data for forming a shape in the whole phase of space frame analysis. The analysis data is conducted by Oracle DBMS(DataBase Management System), GUI(Graphic User Internet) by Java Applet and connection with server and database by Java Servlet respectively. The result from modeling and analysis is provided as graphic and text file forms by web browsers. Programs can be executed irrespective of user's OS by using internet and highly-secured system is constructed taking advantage of Java. Of great efficiency is maintaining and recycling data as the whole is dealt by database from the beginning to the end of program.

  • PDF

조현병 관련 주요 일간지 기사에 대한 텍스트 마이닝 분석 (Text-Mining Analyses of News Articles on Schizophrenia)

  • 남희정;류승형
    • 대한조현병학회지
    • /
    • 제23권2호
    • /
    • pp.58-64
    • /
    • 2020
  • Objectives: In this study, we conducted an exploratory analysis of the current media trends on schizophrenia using text-mining methods. Methods: First, web-crawling techniques extracted text data from 575 news articles in 10 major newspapers between 2018 and 2019, which were selected by searching "schizophrenia" in the Naver News. We had developed document-term matrix (DTM) and/or term-document matrix (TDM) through pre-processing techniques. Through the use of DTM and TDM, frequency analysis, co-occurrence network analysis, and topic model analysis were conducted. Results: Frequency analysis showed that keywords such as "police," "mental illness," "admission," "patient," "crime," "apartment," "lethal weapon," "treatment," "Jinju," and "residents" were frequently mentioned in news articles on schizophrenia. Within the article text, many of these keywords were highly correlated with the term "schizophrenia" and were also interconnected with each other in the co-occurrence network. The latent Dirichlet allocation model presented 10 topics comprising a combination of keywords: "police-Jinju," "hospital-admission," "research-finding," "care-center," "schizophrenia-symptom," "society-issue," "family-mind," "woman-school," and "disabled-facilities." Conclusion: The results of the present study highlight that in recent years, the media has been reporting violence in patients with schizophrenia, thereby raising an important issue of hospitalization and community management of patients with schizophrenia.

Data Dictionary 기반의 R Programming을 통한 비정형 Text Mining Algorithm 연구 (A study on unstructured text mining algorithm through R programming based on data dictionary)

  • 이종화;이현규
    • 한국산업정보학회논문지
    • /
    • 제20권2호
    • /
    • pp.113-124
    • /
    • 2015
  • 미리 선언된 구조를 이용하여 수집 저장된 정형적 데이터와는 달리 웹 2.0의 시대에서 일반 사용자들이 평상시에 사용하는 자연어 형태로 작성된 비정형 데이터 분석은 과거보다 훨씬 더 넓은 응용범위를 가지고 있다. 데이터 양이 폭발적으로 증가하고 있다는 특성뿐 만 아니라 인간의 감성이 그대로 표현된 특성을 가진 텍스트에서 의미 있는 정보를 추출하는 빅데이터 분석 기법을 텍스트마이닝(Text Mining)이라 하며 본 연구는 이를 주제로 하고 있다. 본 연구를 위해 오픈 소스인 통계분석용 소프트웨어 R 프로그램을 이용하였으며, 비정형 텍스트 문서를 웹 환경에서 수집, 저장, 전처리, 분석 작업과 시각화(Frequency Analysis, Cluster Analysis, Word Cloud, Social Network Analysis)작업 등의 과정에 관한 알고리즘 구현을 연구하였다. 특히, 연구자의 연구 영역 분석에 초점을 더욱 높이기 위해 Data Dictionary를 참조한 키워드 추출 기법을 사용하였다. 실제 사례에 적용한 R은 다양한 OS 구동, 일반적 언어와의 인터페이스 지원 등 통계 분석용 소프트웨어로써 매우 유용하다는 점을 발견할 수 있었다.

Combining Multiple Sources of Evidence to Enhance Web Search Performance

  • Yang, Kiduk
    • 한국도서관정보학회지
    • /
    • 제45권3호
    • /
    • pp.5-36
    • /
    • 2014
  • 웹은 하이퍼링크 및 야후와 같이 수동으로 분류된 웹 디렉토리 처럼 문서의 콘텐츠를 넘어선 다양한 정보의 소스가 풍부하다. 이 연구는 웹문서 내용을 활용한 텍스트기반의 검색 방식, 하이퍼 링크를 활용한 링크 기반의 검색 방식, 그리고 야후의 카테고리를 활용한 분류 기반의 검색 방식을 융합하므로서 여러 정보소스를 결합하면 검색 성능을 향상시킬 수 있다는 기존 융합검색연구들을 확장시켰다. 텍스트, 링크, 분류 기반 검색 결과를 여러가지 선형조합식으로 생성한 융합결과를 기존의 검색 평가 지표를 사용하여 각각의 검색 결과와 비교 한 후, 검색결과 오버랩의 중요성 또한 조사 하였다. 본 연구는 텍스트, 링크, 분류 기반 검색의 솔루션 스패이스들의 다양성이 융합검색의 적합성을 제시한다는 결론과 더불어 시스템 파라미터의 영향, 그리고 오버랩, 문서순위, 관련성들의 상호 관계 같은 융합 환경의 중요한 특성들을 분석하였다.

웹 멀티미디어 컨텐츠의 디자인과 유용성분석에 대한 연구 (Study on the Design and Usability factor analysis of Web Multimedia Contents)

  • 고은영;신순호
    • 디자인학연구
    • /
    • 제17권4호
    • /
    • pp.69-78
    • /
    • 2004
  • 컴퓨터 기술의 발달과 웹 환경의 개선은 e비즈니스의 확대와 웹 사이트의 트랜드에 영향을 주었다. 멀티미디어를 사용한 사이트의 인기가 상승하고 경쟁 사이트보다 높은 인지도를 보여주고 있어 멀티미디어 도입이 활성화되고 있다. 웹 멀티미디어 콘텐츠에 있어서도 평가기준에 합당한 멀티미디어 컨텐츠의 구성요소가 필요하다. 이들 구성요소는 정보디자인, 영상디자인, 인터랙티브 디자인의 요소로 정리할 수 있다. 이 요소들을 사용자에게 대표적인 웹 멀티미디어 사이트를 평가하도록 하였다. 웹 사이트의 선정은 대표적인 웹 사이트의 유형인 HTML기반, 플래시 기반, 혼합기반으로 한정하였다. 사용자가 평가한 데이터를 이용하여 디자인과 멀티미디어의 요소별 연관성과 상관관계를 규명하는 통계분석을 하였다. 서울, 경기, 충청지방에 거주하는 C대학교 재학생 중 디자인 비전공자들 101명을 대상으로 분석하였다. 설문내용은 인터넷을 이용하여 코카콜라, 나이키, 삼성전자 각 기업의 한국어 사이트에 방문하여 평가하도록 하였다. 설문의 평가 방식은 각 항목 당 5점 척도로 평가하도록 하여 이를 점수화했다. 설문 분석을 위한 통계 패키지는 SPSS Ver 10.0을 사용하였다. 기술 분석을 통해 각 유형별 웹 사이트가 정보디자인, 영상디자인, 인터랙티브디자인, 디자인에서 사용자 평가를 분석하였다. 웹 멀티미디어 컨텐츠 유형에 따른 웹 사이트 평가에 같은 웹 멀리미디어 평가 항목을 설문한 결과 eigenvalue의 요인추출개수가 다르게 나왔으며 회귀식 또한 다르게 나왔다. 이는 웹 사이트를 제작할 때 목적에 따라 유형의 방법을 다르게 선택해야하는 것을 알 수 있었다.

  • PDF

외국인 암 환자를 위한 국내 방사선치료 영문 텍스트 가독성 분석 (Analysis of Readability of Text in English for Radiation Therapy for Foreigner Patient with Cancer in South Korea)

  • 김대건;김성철
    • 대한방사선기술학회지:방사선기술과학
    • /
    • 제45권6호
    • /
    • pp.543-552
    • /
    • 2022
  • This study compared and analyzed with the United States(USA) to evaluated the level of readability of radiotherapy information (English text) provide to foreign patients with cancer by medical institutions in South Korea (KOR). A total of 20 the KOR and USA medical hospitals in 10 each provide information for radiation therapy technology were selected. The readability was comparatively analyzed a total of three aspects (lexical, syntactic, cohesion and readability) by using a Coh-Metrix on-line web program. In readability respect, the mean of the Flesch Reading Ease (FRE) was lower in the KOR (8.3) than in the USA (23.2), Flesch-Kincaid grade level (FKGL) was higher in the KOR than in the USA (14.2) indicating that KOR was less readable than the US (p<.05). In both KOR and USA, the reading level (literacy) of the English text for the radiation therapy was found to be higher than high school (FRE level 50 or lower). Therefore, text information in English for the radiation therapy to foreign patients with cancer should be lowered to elementary school level and read to improve the quality of medical services.