一、組詞是啥?
由于關(guān)鍵詞有100個字符限制,所以這要求我們在有限的字符里面進行有效組合。
“組詞”,就是把一些具有“共同部分”的詞組合到一起,如App的關(guān)鍵詞包含“騰訊新聞”和“網(wǎng)易新聞”這兩個詞,就可以組合成“騰訊網(wǎng)易新聞”,而用戶搜索時,搜索“騰訊新聞”或“網(wǎng)易新聞”也還是能搜到該App。
二、蘋果分詞技術(shù)
蘋果會對后臺填寫的100個關(guān)鍵詞利用算法進行分詞。然后拆分出你覆蓋了多少詞。
“分詞”就是把一個漢語字符串分成一個個詞的過程。分詞的例子如“騰訊新聞”的分詞為:“騰訊|新聞”,“網(wǎng)易新聞”的為“網(wǎng)易|新聞”。由于中文分詞經(jīng)常會有“歧義”現(xiàn)象,如“兵乓球拍賣完了”可切分為“乒乓球|拍賣|完了”又可以切分為“乒乓球拍|賣|完了”,針對這種情況,搜索系統(tǒng)一般會把兩種分詞形式都記錄下來,以供搜索時使用。
三、蘋果搜索算法——詞袋模型
下面很長一段可以不用看,總體意思就是,不要重復(fù)關(guān)鍵詞,以及在進行組詞的時候需要詞的意思,例如支付寶貝,這個詞不會被識別為支付寶,只會拆分為支付+寶貝。應(yīng)該改為支付寶xx
“詞袋模型”是搜索引擎中的一種簡單假設(shè),其不考慮詞的“順序”,認為一個文本就是
是一堆詞的“集合”。也就是如兩個文本“騰訊新聞”、“新聞騰訊”,對搜索引擎而言,是完全一樣的。這種假設(shè)也是我們能夠進行組詞的基礎(chǔ)。
我們還是以“騰訊新聞”和“新聞騰訊”,以及其組詞“騰訊網(wǎng)易新聞”為例,其“詞袋”模型如下圖所示:
“騰訊新聞”和“新聞騰訊”,及其組詞“騰訊網(wǎng)易新聞”的詞袋模型
由于“詞袋”模型是一個“集合”模型,可以不考慮重復(fù)元素,因此上面袋子中的兩個“新聞”可以視為一個。從上圖中可以看到,“騰訊新聞”+“新聞騰訊”,和“騰訊網(wǎng)易新聞”的詞袋模型是完全等價的,也就是說對搜索引擎而言,他們是完全一樣的。
然后,我們還可以利用上述模型,簡單描述用戶搜索的過程。搜索的時候,搜索系統(tǒng)首先會在對用戶輸入的搜索詞進行分詞,然后在關(guān)鍵詞的“袋子”里面依次查找搜索詞的分詞。還是上面的例子,如用戶搜索“騰訊新聞”時,流程如下圖所示:
基于“詞袋”模型的查找流程,搜索系統(tǒng)在“詞袋”中分別查找“騰訊”和“新聞”這兩個搜索詞的分詞
然后我們再看下“支付寶”和“寶貝”的例子,說明為啥他們不能組詞。我們把“支付寶”和“寶貝”組成“支付寶貝”,但其分詞的時候,可能會分成“支付|寶貝”,這種分詞歧義就可能造成搜索“支付寶”的時候,搜不到該App,具體如下圖所示:
關(guān)鍵詞“支付寶”和“寶貝”組成“支付寶貝”后,由于可能的分詞歧義,用戶搜索“支付寶”時,可能會搜索不到該App。
四、逗號的使用
“最大限度組詞”,其實已經(jīng)把所有可能組合的詞,都組到了一起,但還有用戶經(jīng)常會問,這樣的組詞還是有“逗號”存在,能不能干脆把全部的逗號都干掉,這樣不是能加更多的詞嗎?
不建議哦,主要出于以下兩種因素:
1、蘋果規(guī)則限制。在2015年之前,很多ASO優(yōu)化服務(wù)商給出的關(guān)鍵詞建議都是沒有任何逗號的,但這種情況多了后,蘋果的關(guān)鍵詞審核就會更嚴格,這樣的形式會被認為是“關(guān)鍵詞堆砌”,審核就不通過,因此,組詞需要“適度”。
2、權(quán)重影響。根據(jù)“詞袋”模型,用戶搜索“騰訊新聞”時,關(guān)鍵詞填寫“騰訊新聞”或者“騰訊網(wǎng)易新聞”,是都能搜到的,這個是沒有問題的。但是,關(guān)鍵詞“騰訊新聞”與用戶搜索詞是完全一致的,這種情況,搜索引擎一般都會有少量的加分。
四、總結(jié)
組詞過程中,我們考慮到蘋果的規(guī)則,一個“詞”不能過長,否則可能會被認為是關(guān)鍵詞堆砌,因此,我們限制了組詞的最大個數(shù),就是最多組合5個詞。
對下載量較少的App,不需要刻意的組詞,因為你的App基本處在長尾位置,一點點的加分,就可能讓你的搜索排名有大幅提升。
對應(yīng)需要“刷”的詞,還有核心帶量的關(guān)鍵詞,建議都用逗號隔開,不進行組詞。