System.ArgumentOutOfRangeException: 索引和長(zhǎng)度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實(shí)現(xiàn)步驟摘要】
本專利技術(shù)涉及數(shù)據(jù)分析,具體為基于大數(shù)據(jù)的媒體信息智能化分析系統(tǒng)及方法。
技術(shù)介紹
1、在當(dāng)今信息爆炸的時(shí)代,媒體廣告投放已成為企業(yè)營(yíng)銷策略中不可或缺的一部分。隨著互聯(lián)網(wǎng)和移動(dòng)設(shè)備的普及,廣告投放的渠道日益多樣化,包括社交媒體、搜索引擎、視頻平臺(tái)等。為了提高廣告投放的效率和效果,企業(yè)亟需借助大數(shù)據(jù)技術(shù)對(duì)媒體信息進(jìn)行智能化分析。廣告投放涉及的媒體數(shù)據(jù)來(lái)源廣泛,包括在線廣告、社交平臺(tái)互動(dòng)、用戶行為日志等。這些數(shù)據(jù)通常以不同的格式和結(jié)構(gòu)存在,給數(shù)據(jù)整合和分析帶來(lái)了挑戰(zhàn)。
2、然而,現(xiàn)有的媒體信息分析系統(tǒng)雖然具備基本的數(shù)據(jù)收集和處理能力,但仍存在一些不足之處,具體體現(xiàn)在廣告投放效果評(píng)估方面。例如,現(xiàn)有的媒體信息分析系統(tǒng)在廣告效果評(píng)估方面多集中于基礎(chǔ)指標(biāo),如點(diǎn)擊率和曝光率等,這樣的單一評(píng)估方式無(wú)法全面反映廣告效果,限制了投放策略的優(yōu)化空間。
技術(shù)實(shí)現(xiàn)思路
1、本專利技術(shù)的目的在于提供基于大數(shù)據(jù)的媒體信息智能化分析系統(tǒng)及方法,以解決上述
技術(shù)介紹
中提出的問題。
2、為了解決上述技術(shù)問題,本專利技術(shù)提供如下技術(shù)方案:
3、基于大數(shù)據(jù)的媒體信息智能化分析方法,方法包括以下步驟:
4、步驟s100.從不同數(shù)據(jù)渠道獲取不同格式的與目標(biāo)廣告投放相關(guān)的媒體數(shù)據(jù),對(duì)獲取的媒體數(shù)據(jù)進(jìn)行格式識(shí)別,并按照格式識(shí)別的結(jié)果對(duì)媒體數(shù)據(jù)進(jìn)行相應(yīng)的處理,將媒體數(shù)據(jù)整合為統(tǒng)一格式,從而得到待分析數(shù)據(jù);
5、步驟s200.獲取目標(biāo)廣告對(duì)應(yīng)的投放記錄,從投放記錄中提取目標(biāo)
6、步驟s300.提取實(shí)際用戶群體的特征,并與目標(biāo)用戶群體特征進(jìn)行比對(duì)分析,從而得到兩者之間的差異;結(jié)合目標(biāo)用戶群體與實(shí)際用戶群體對(duì)應(yīng)特征之間的差異,評(píng)估目標(biāo)廣告投放策略的投放效果;
7、步驟s400.根據(jù)目標(biāo)廣告的投放效果評(píng)估指數(shù),分析目標(biāo)廣告對(duì)應(yīng)的投放策略的優(yōu)化需求系數(shù);根據(jù)優(yōu)化需求系數(shù)對(duì)相應(yīng)的投放策略進(jìn)行分析,并基于分析結(jié)果輸出相應(yīng)的提示信息。
8、進(jìn)一步的,步驟s100包括:
9、s101.從不同數(shù)據(jù)渠道獲取不同格式的有關(guān)目標(biāo)廣告投放相關(guān)的媒體數(shù)據(jù),所述媒體數(shù)據(jù)的格式包括文本、圖像、音頻以及視頻格式,且每條媒體數(shù)據(jù)對(duì)應(yīng)的數(shù)據(jù)格式并不唯一;例如,一個(gè)社交媒體帖子可能有文本描述、圖片、音頻以及視頻;針對(duì)每條媒體數(shù)據(jù)di,進(jìn)行格式識(shí)別,其中i表示媒體數(shù)據(jù)編號(hào),取正整數(shù);按照格式識(shí)別的結(jié)果,對(duì)當(dāng)前的媒體數(shù)據(jù)進(jìn)行劃分,從而將媒體數(shù)據(jù)di表示為:di={d1,d2,...,dn}i,其中d1表示媒體數(shù)據(jù)di的第1個(gè)數(shù)據(jù)段,d2表示媒體數(shù)據(jù)di的第2個(gè)數(shù)據(jù)段,以此類推,dn表示媒體數(shù)據(jù)di的第n個(gè)數(shù)據(jù)段,其中n表示媒體數(shù)據(jù)di對(duì)應(yīng)的數(shù)據(jù)格式編號(hào),取1到4,分別表示文本、圖像、音頻以及視頻格式;
10、s102.針對(duì)每條媒體數(shù)據(jù)di中的圖像、音頻以及視頻格式的數(shù)據(jù)段,都轉(zhuǎn)換成文本格式,將轉(zhuǎn)換后的文本格式數(shù)據(jù)取代對(duì)應(yīng)的圖像、音頻以及視頻格式的數(shù)據(jù)段,從而將媒體數(shù)據(jù)表示為di’,計(jì)算媒體數(shù)據(jù)di’各數(shù)據(jù)段的數(shù)據(jù)占比b,且b=n_dj/n_di’,其中n_dj表示媒體數(shù)據(jù)di'中的第j個(gè)數(shù)據(jù)段的字節(jié)數(shù),n_di’表示媒體數(shù)據(jù)di’的字節(jié)數(shù);對(duì)媒體數(shù)據(jù)di’的每個(gè)數(shù)據(jù)段進(jìn)行語(yǔ)義分析,從而組成相應(yīng)的語(yǔ)義特征向量集vi,且v={v1,v2,...,vn}i,同理,v1表示第1個(gè)數(shù)據(jù)段的語(yǔ)義特征向量,v2表示第2個(gè)數(shù)據(jù)段的語(yǔ)義特征向量,vn表示第n個(gè)數(shù)據(jù)段的語(yǔ)義特征向量,且每個(gè)語(yǔ)義特征向量包含多維度信息,例如關(guān)鍵詞、主題等;
11、s103.根據(jù)媒體數(shù)據(jù)di’的語(yǔ)義特征向量集vi,計(jì)算每個(gè)數(shù)據(jù)段之間的語(yǔ)義關(guān)聯(lián)指數(shù)l,具體計(jì)算公式為:ljk=(vj·vk)/|vj||vk|,其中l(wèi)jk表示第j個(gè)數(shù)據(jù)段與第k個(gè)數(shù)據(jù)段之間的語(yǔ)義關(guān)聯(lián)指數(shù),vj表示第j個(gè)數(shù)據(jù)段對(duì)應(yīng)的語(yǔ)義特征向量,vk表示第k個(gè)數(shù)據(jù)段對(duì)應(yīng)的語(yǔ)義特征向量,且j和k均取1到n,j≠k;針對(duì)每個(gè)數(shù)據(jù)段di,結(jié)合數(shù)據(jù)占比和語(yǔ)義關(guān)聯(lián)指數(shù),計(jì)算相應(yīng)的語(yǔ)義關(guān)聯(lián)強(qiáng)度g,且gi=b×∑j∈[1,n],|lij|;針對(duì)每條媒體數(shù)據(jù)di的數(shù)據(jù)段,根據(jù)語(yǔ)義關(guān)聯(lián)強(qiáng)度g的大小關(guān)系進(jìn)行排序,將語(yǔ)義關(guān)聯(lián)強(qiáng)度g最大的數(shù)據(jù)段作為主要數(shù)據(jù)段,將語(yǔ)義關(guān)聯(lián)強(qiáng)度g不等于0的數(shù)據(jù)段作為次要數(shù)據(jù)段;將語(yǔ)義關(guān)聯(lián)強(qiáng)度g等于0的數(shù)據(jù)段作為無(wú)關(guān)數(shù)據(jù)段,并進(jìn)行篩除,從而得到媒體數(shù)據(jù)d;將媒體數(shù)據(jù)d整理成結(jié)構(gòu)化數(shù)據(jù)進(jìn)行存儲(chǔ),從而得到待分析數(shù)據(jù)。
12、進(jìn)一步的,步驟s200包括:
13、s201.從數(shù)據(jù)庫(kù)中獲取目標(biāo)廣告對(duì)應(yīng)的投放記錄,整理得到目標(biāo)廣告投放記錄數(shù)據(jù)集f,且f{f1,f2,...,fm},其中f1表示目標(biāo)廣告的第1個(gè)投放記錄,f2表示目標(biāo)廣告的第2個(gè)投放記錄,以此類推,fm表示目標(biāo)廣告的第m個(gè)投放記錄;其中目標(biāo)廣告的每個(gè)投放記錄僅對(duì)應(yīng)一個(gè)投放策略,且每個(gè)投放記錄都包含多個(gè)特征,如投放時(shí)間、投放平臺(tái)、投放費(fèi)用、投放區(qū)域、用戶互動(dòng)數(shù)據(jù)等;對(duì)于每個(gè)投放記錄fe,從中提取相應(yīng)的投放策略,并將提取到的投放策略定義為策略數(shù)據(jù)集se,從而得到目標(biāo)用戶群體特征,且se={s1,s2,s3,s4},其中,s1表示投放時(shí)間的數(shù)值表示,s2表示地域編碼,s3表示目標(biāo)用戶群體特征,s4表示預(yù)算;
14、s202.從待分析數(shù)據(jù)中獲取用戶行為數(shù)據(jù),并從用戶行為數(shù)據(jù)中提取特征,構(gòu)建特征矩陣u,且特征矩陣u的維數(shù)為q×r,其中q表示用戶數(shù)量,r表示特征的數(shù)量;使用k-means算法對(duì)用戶進(jìn)行聚類,從而識(shí)別出不同的用戶群體,且將識(shí)別到的用戶群體表示為pu,u表示用戶群體的編號(hào);針對(duì)每個(gè)用戶群體,獲取對(duì)應(yīng)用戶數(shù)量,將用戶數(shù)量最多的用戶群體定義為實(shí)際用戶群體。
15、進(jìn)一步的,使用k-means算法對(duì)用戶進(jìn)行聚類的具體過程如下:
16、針對(duì)特征矩陣u進(jìn)行標(biāo)準(zhǔn)化處理,選擇k0個(gè)聚類中心,且將聚類中心記為c,對(duì)于每個(gè)用戶q,計(jì)算每個(gè)用戶q到所有聚類中心的距離,并將其分配到最近的聚類中,其中每個(gè)用戶q到所有聚類中心的距離的計(jì)算公式為:
17、d(uh,cp)={σw∈[1,r],(uh_w-cp_w)}^(1/2),
18、其中,uh表示第h個(gè)用戶的特征向量,cp表示第p個(gè)聚類中心,uh_w表示第h個(gè)用戶的第w個(gè)特征值,cp_w表示第p個(gè)聚類中心的第w個(gè)特征值;在所有用戶分配完成后,重新計(jì)算每個(gè)聚類的中心c,且更新公式為:
19、cp=(1/|qp|)σuh∈qp,uh,
20、其中qp表示被分配到聚類p的所有用戶特征向量,|qp|是聚類p中的用戶的數(shù)量;
21、重復(fù)上述內(nèi)容,直到達(dá)到預(yù)設(shè)的迭代次數(shù)。
22、進(jìn)一步的,步驟s300包括:
23、s301.提取實(shí)際用戶群體特征和目標(biāo)用戶提取特征,將實(shí)際用戶群體特征和目標(biāo)用戶群體特征進(jìn)行標(biāo)準(zhǔn)化處理,分別針對(duì)實(shí)際用戶群體特征和目標(biāo)用戶群本文檔來(lái)自技高網(wǎng)...
【技術(shù)保護(hù)點(diǎn)】
1.基于大數(shù)據(jù)的媒體信息智能化分析方法,其特征在于:所述方法包括以下步驟:
2.根據(jù)權(quán)利要求1所述的基于大數(shù)據(jù)的媒體信息智能化分析方法,其特征在于:所述步驟S100包括:
3.根據(jù)權(quán)利要求1所述的基于大數(shù)據(jù)的媒體信息智能化分析方法,其特征在于:所述步驟S200包括:
4.根據(jù)權(quán)利要求3所述的基于大數(shù)據(jù)的媒體信息智能化分析方法,其特征在于:所述使用K-means算法對(duì)用戶進(jìn)行聚類的具體過程如下:
5.根據(jù)權(quán)利要求1所述的基于大數(shù)據(jù)的媒體信息智能化分析方法,其特征在于:所述步驟S300包括:
6.根據(jù)權(quán)利要求5所述的基于大數(shù)據(jù)的媒體信息智能化分析方法,其特征在于:所述步驟S400包括:
7.基于大數(shù)據(jù)的媒體信息智能化分析系統(tǒng),應(yīng)用于權(quán)利要求1-6中任一項(xiàng)所述的基于大數(shù)據(jù)的媒體信息智能化分析,其特征在于:所述系統(tǒng)包括:數(shù)據(jù)采集與處理模塊、用戶群體特征分析模塊、特征對(duì)比與差異分析模塊、投放效果評(píng)估模塊以及優(yōu)化建議模塊;
8.根據(jù)權(quán)利要求7所述的基于大數(shù)據(jù)的媒體信息智能化分析系統(tǒng),其特征在于:所述數(shù)據(jù)采集與
9.根據(jù)權(quán)利要求7所述的基于大數(shù)據(jù)的媒體信息智能化分析系統(tǒng),其特征在于:所述用戶群體特征分析模塊包括投放記錄提取單元和用戶行為數(shù)據(jù)分析單元;
10.根據(jù)權(quán)利要求7所述的基于大數(shù)據(jù)的媒體信息智能化分析系統(tǒng),其特征在于:所述投放效果評(píng)估模塊包括效果評(píng)估指數(shù)計(jì)算單元和優(yōu)化需求分析單元;
...【技術(shù)特征摘要】
1.基于大數(shù)據(jù)的媒體信息智能化分析方法,其特征在于:所述方法包括以下步驟:
2.根據(jù)權(quán)利要求1所述的基于大數(shù)據(jù)的媒體信息智能化分析方法,其特征在于:所述步驟s100包括:
3.根據(jù)權(quán)利要求1所述的基于大數(shù)據(jù)的媒體信息智能化分析方法,其特征在于:所述步驟s200包括:
4.根據(jù)權(quán)利要求3所述的基于大數(shù)據(jù)的媒體信息智能化分析方法,其特征在于:所述使用k-means算法對(duì)用戶進(jìn)行聚類的具體過程如下:
5.根據(jù)權(quán)利要求1所述的基于大數(shù)據(jù)的媒體信息智能化分析方法,其特征在于:所述步驟s300包括:
6.根據(jù)權(quán)利要求5所述的基于大數(shù)據(jù)的媒體信息智能化分析方法,其特征在于:所述步驟s400包括:
7.基于大數(shù)據(jù)的媒體信...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:呂晴霞,
申請(qǐng)(專利權(quán))人:北京三人行時(shí)代數(shù)字科技有限公司,
類型:發(fā)明
國(guó)別省市:
還沒有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。