مقاله انگلیسی تحقیقی درباره ی تکنولوژی، الگوریتم و کاربرد وب کاوی (IEEE 2017)

 

 

عنوان فارسی مقاله تحقیقی درباره ی تکنولوژی، الگوریتم و کاربرد وب کاوی
عنوان انگلیسی مقاله Research on Technology, Algorithm and Application of Web Mining
نمونه مقاله انگلیسی I. INTRODUCTION

What is Web mining? It is the process that discover and extract the useful mode and knowledge that people are interested from the massive Web documents and activities through data mining technology [1]. Compared to the wellknown Data mining, Web mining can be extended to a deeper and broader areas, the differences between them are also very obvious: the object of data mining is the data stored in database, that is to say, the structured data; Web Mining aims at the contents or structure of Web document, which has a feature of wide-distributed, dynamic and heterogeneous, and contains unstructured or semi-structured data. Based on the diversity of information on the Web, Web mining is divided into the following category as shown in figure 1: Web structure mining, Web content mining and Web usage mining [2]. These three mining methods are different in the aspect of dealing with the main data, processing methods and application areas  ۱) Web Structure Mining mainly deals with Web structure data, it can be divided into page structure mining and URL mining (hyperlink mining) [3]. 2) Web Content Mining mainly deals with unstructured data and semi-structured data, can be refined into Web text mining and Web multimedia mining based on the content, in which multimedia mining is a popular research topic at present [4]. 3) Web Usage Mining can be divided into general access mode analysis and customizing Web site, it analyzes Web site logs to find some valuable knowledge. This paper will analyze the realization of Web content mining and Web structure mining, their basic algorithm principles and their application areas.

II. WEB STRUCTURAL MINING

A. Introduction of Structural Mining Massive Web sites constitute the entire Internet network, and each page in these Web sites more or less includes some hyperlinks, which contains a lot of potential information. The purpose of Web structure mining is to dig out the hidden knowledge, so that it can be fully applied. For example, if a paper is cited for a lot of times, it is proved that this paper is very authoritative in its field of study. Similarly, if there are a lot of Web pages pointing to the same page X, we think that page X has higher authority. In the field of search engine, it is very important to place the most authoritative page at the first of the search results, because when using the search engine users want to acquire authoritative and publicly recognized results, rather than some of the incorrect result pages or even insignificant ad page. Structural mining is based on this judging method to get a lot of information and help people with navigation and recommendations of the authoritative Web pages. This article will briefly introduce two well-known structure mining algorithm, PageRank and HITS. B. PageRank Algorithm The PageRank algorithm draws on the traditional citation analysis: when page A has a link to page B, we think that B gets the score that A contributes to it. This score depends on the importance of A, that is to say, the more important page A is, the higher the contribution score of page B gets. Based on this premise, Google uses this algorithm to give each page a number of values (PageRank) as a reference to the page quality. PageRank values from 0 to 10, the higher the value, the higher the quality and popularity of the page, the more forward the corresponding search results.

نمونه ترجمه کامپیوتری مقدمه

معدن وب چیست؟ این فرآیند است که کشف و استخراج حالت مفید و دانش است که مردم از اسناد گسترده وب و فعالیت ها از طریق تکنولوژی داده کاوی علاقه مند هستند [1]. در مقایسه با معادله داده مشهور، معدن وب را می توان به مناطق عمیق تر و وسیع گسترش داد، تفاوت بین آنها نیز بسیار واضح است: هدف داده کاوی داده ها ذخیره شده در پایگاه داده است، یعنی داده های ساخت یافته؛ وب منحصر به فرد در محتویات یا ساختار سند وب است که دارای ویژگی گسترده ای توزیع، پویا و ناهمگن است و شامل اطلاعات غیر ساختاری یا نیمه ساختاری است. بر اساس تنوع اطلاعات در وب، معدن وب به عنوان زیر نشان داده شده است: شکل 1: ساخت ساختار وب، استخراج محتوای وب و استفاده از وب [2]. این سه روش معدن در زمینه پردازش داده های اصلی، روش های پردازش و زمینه های کاربردی متفاوت است. 1) ساختار وب معادن عمدتا با داده های ساختار وب مرتبط است، می توان آن را به ساختار صفحه و استخراج معادن URL (mining hyperlink mining) تقسیم کرد. ] 2) محتواي محتواي وب به طور عمده با داده هاي بدون ساختار و داده هاي نيمه ساختار يافته، مي تواند به معدن وب متن و معدن چندرسانه اي وب مبتني بر محتوايي ​​باشد كه در آن معدن چندرسانه اي موضوعي محبوب در حال حاضر مورد توجه است [4]. 3) استفاده از وب معادن را می توان به تجزیه و تحلیل حالت دسترسی کلی و سفارشی کردن وب سایت تقسیم کرد، آن را تجزیه و تحلیل وبلاگ های وب سایت برای پیدا کردن برخی از دانش ارزشمند است. این مقاله به بررسی تحقق کاوش محتوا وب و ساخت معدن وب، اصول الگوریتم پایه و زمینه های کاربرد آنها پرداخته است.

دوم معدنکاری ساختاری وب 

A. معرفی مقدماتی معادن ساختمانی وب سایت های عظیم کل شبکه اینترنت را تشکیل می دهند و هر صفحه ای در این وب سایت ها شامل برخی از لینک ها می شود که حاوی اطلاعات بالقوه زیادی است. هدف از ساخت ساختار وب، استخراج دانش پنهان است تا بتوان آن را به طور کامل اعمال کرد. به عنوان مثال، اگر یک مقاله برای چندین بار ذکر شده است، ثابت شده است که این مقاله در حوزه مطالعه بسیار معتبر است. به طور مشابه، اگر تعداد زیادی از صفحات وب به همان صفحه X وجود داشته باشد، ما فکر می کنیم که صفحه X قدرت بیشتری دارد. در زمینه موتور جستجو، بسیار مهم است که صفحه معتبر ترین در اولین نتایج جستجو قرار گیرد، زیرا هنگام استفاده از موتورهای جستجو، کاربران می خواهند به دست آوردن نتایج معتبر و عمومی شناخته شده، به جای برخی از صفحات نتیجه نادرست یا حتی صفحه آگهی ناچیز. معادن ساختمانی براساس این روش قضاوت برای دریافت اطلاعات فراوانی و کمک به افراد ناوبری و توصیه های صفحات معتبر وب است. این مقاله به طور خلاصه دو الگوریتم معروف ساخت ساختاری، PageRank و HITS را معرفی می کند. الگوریتم PageRank الگوریتم PageRank الگوریتم PageRank به تحلیل استناد سنتی متکی است: زمانی که صفحه A دارای پیوند به صفحه B است، ما فکر می کنیم که B نمره ای را که A به آن کمک می کند، به دست می آورد. این نمره به اهمیت A بستگی دارد، یعنی مهمتر صفحه A است، نمره مشارکت صفحه B بالاتر است. بر اساس این فرض، Google از این الگوریتم استفاده می کند تا به هر صفحه تعدادی از مقادیر (PageRank) را به عنوان یک مرجع به کیفیت صفحه ارائه دهد. مقادیر PageRank از 0 تا 10، بالاتر از آن ارزش، کیفیت و محبوبیت صفحه بالاتر است، نتایج جستجو مربوط به آن بیشتر است.

توجه؛ (این ترجمه توسط نرم افزار انجام شده و ویرایش نشده است و احتمال وجود اشتباه در آن وجود دارد. در صورت ثبت سفارش، ترجمه توسط مترجمین مجرب انجام خواهد شد. برای مشاهده نمونه ترجمه های تخصصی و اخیر مترجمین جهت اطمینان از کیفیت ترجمه، اینجا کلیک نمایید.)

سال انتشار 2017
ناشر آی تریپل ای
مجله  کنفرانس بین المللی مهندسی و علوم محاسباتی – International Conference on Computational Science and Engineering
کلمات کلیدی  تکنولوژی وب کاوی؛ کاوش ساختار وب؛ کاوش محتوای وب؛ کاوش چند رسانه ای
کلمات کلیدی انگلیسی
Web mining technology; Web structure mining˗ Web content mining; Multi-media mining
صفحات مقاله انگلیسی 4
مناسب برای رشته مهندسی کامپیوتر، فناوری اطلاعات، مدیریت
مناسب برای گرایش مدیریت فناوری اطلاعات، نرم افزار، الگوریتم ها و محاسبات
توضحیات این مقاله انگلیسی جدید بوده و تا کنون ترجمه نشده است. جهت ثبت سفارش ترجمه از لینکهای زیر استفاده نمایید.
دانلود مقاله انگلیسی ○ دانلود رایگان مقاله انگلیسی با فرمت pdf (کلیک کنید)
سفارش ترجمه فارسی ○ سفارش انجام ترجمه و تایپ این مقاله (کلیک کنید)
سایر مقالات این رشته ○ مشاهده سایر مقالات رشته مهندسی کامپیوتر (کلیک کنید)

 

 

دیدگاهتان را بنویسید