コピペ記事をどう見抜く?どうやってコピペチェックする?

 

外注さんに100%時期作成を丸投げする方法でブログ投稿を開始して、あと2日で丸々1ヶ月になる管理人めばるです、こんにちは<(_ _)>

順調に初アクセスが来て少しずつ伸びており、更には初報酬も発生し、その後もちらほら報酬が出ている状況です。
記事投稿開始~初アクセス~初報酬

おそらく、これは、まぁまぁのスタートが切れているのではないかと思います(^^)

しかし、ここまで順風満帆かというと、もちろんそんな事はありません。

やっぱり、はじめて外注さんに依頼をして、仕事をしてもらっていますので、予想外の事も多々あります。

そんな中で、一番、悩んだ。。いや、現在でも悩んでいるのはコレですかね?

そう、コピペ記事・・・

コピペ記事って? 何がどうダメなの?

コピペ・・・コピーアンドペーストのことです。

で、コピペ記事っていうのは、ネット上にあるサイトをコピーして、それを自分の記事にペースト、つまり貼り付けて、さも自分の記事のように投稿している記事です。。。よね?

まぁ、記事作成を外注しているなら、コピペ記事を納品されて、それを自分のブログに投稿してしまう感じです。
 

え?コピペが何故ダメなのかって、そりゃ、普通に考えたらダメですよね。

だって、人が書いたことをパクってるんですから・・

小さな子どもでも、人のものはパクっちゃダメって知っていますよね。
 

で、実際、コピペ記事なんてものをアップしてるとどうなるかっていうと、まず、対コピーしたサイトでいうと、そのサイトの持ち主の著作権を侵害したことになるので、相手がそれに気づいて訴えてくれば、著作権法によって訴えられてしまう可能性があります。

訴えられて、裁判になって、まぁ、負けますよね。

そうなると、著作権法によって罰せられるわけです。

119条違反で「10年以下の懲役、もしくは1000万円以下の罰金」です。
 

更には、民事で損害賠償請求をされるかもしれませんね。
 

まぁ、上述の刑事、民事の問題は、そこまでされる確率は低いかもしれませんが、間違いなくあり得ることです。

そして、確率的にも高くなってくる事がもう一つ!
 

Googleに嫌われる!!

そう、コピペ記事なんて投稿していたら、Googleさんに嫌われてしまうんです!

嫌われるっていっても、「あんた嫌い!こっち来んといて!」ってくらいではすみません。
 

そもそも多くの人が利用している検索エンジンを作っているのはGoogleです。

Yahoo!だって、Googleの検索エンジンを採用してるので、検索結果はほぼ一緒です。

そんなGoogleさんに嫌われる・・つまり「あなたのブログはコピーコンテンツです」と烙印を押されれば、そこまでお金と労力をかけて作りこんできたブログがペナルティを喰らって、検索圏外に吹き飛ばされてしまうというリスクを孕んでいるわけなんです。
 

そうなると当然、ブログに貼り付けてあるアドセンス広告は誰もクリックしてくれませんから、収益がなくなり、更にはアドセンスのアカウント停止というおまけつき・・・

サイトを複数運営しているなら、ブログが1つ飛んでも他があるかもしれませんが、アドセンスのアカウントは1人につき1つなので、アカウント停止になれば、他のアドセンスブログも全部アウトです。
 

自分でコピペ記事を投稿してたんなら、自業自得ですが、お金を払って記事を書いてもらって、それがコピペ記事でペナルティを喰らったら、そりゃもう目も当てられ前んよね。
 

ですから!
 コピペチェックだけは絶対におろそかにしてはいけない のです!!!
 

どこからコピペ? その線引きは?

コピペって言ったって、ほんとに丸々どっかのサイトからパクってきて、それを納品するような強者の外注さんは、まずいないでしょう。

知らんけど・・・・。
 

そう、どこからがコピペなのかという問題もあります。

つまり、ネットで情報を拾ってきて、記事を作るっていうことは、その記事を書いた人の完全オリジナルではないわけで、本来ならば参考文献とかをしっかり網羅して掲載しないといけないところ。

けど、現実では、よその記事を適当に拾い集めてきて、それをつなぎ合わせて、改造している記事なんてごまんとあります。

リライトなんて、聞こえのいい呼び方もありますが、ようはコピーして改造してペースト。。。

つまり、パクリですよね、それ!
 

けど、その線引きは非常に難しいところなんです。
 

どうやってコピペチェックする?

もう1つ問題があります。

納品された記事を読んだって、それがコピペかどうかなんて、自分の記事がパクられたのでなければ分かりませんよね。

問題は、 どうやってコピペチェックするか です。
 

しかし、世の中には何でも便利なものがありますね。

そう、コピペチェックツールを使えばいいわけです。
 

けど、調べてみたらコピペチェックツールもいろいろありますね。

それこそ、無料のものから有料のもの、有料のものも安いのから高いのまで・・・

で、何がいいのか分かりませんので、めばるはとりあえず今から紹介する3つの無料ツールを試してみることにしました。
 

こぴらん

こぴらんではこのように紹介されています。

文章を自動的に文に分解。その文が他サイトやブログ等で使用されていないかどうかをチェックできる簡易コピペチェッカーです。

こぴらん
 

まさに簡易チェックツールって感じで、とてもサクサク使いやすく、結果が出る時間も早くて、コレが良さそうだな~と思いました。
 

けどですね・・・・

イマイチ、結果の判断の仕方が分からない・・・

いや、これは、ひょっとしたらめばるが分からないだけかもしれないんですけどね・・・

「類似数」っていうのが分節ごとに出てきて、まぁ、それが多いとダメなんだろうなってのは分かるんですけど、それがどれ以上だとダメなのかってのが非常に分かりにくかったです。

上記の画像だと、8320と11と29という数字が出てますね。

文節を区切ってチェックして、その文節は基本的に縦に続いているので、類似数が「無」でなく数字が出ているが続くのがダメなんだろうというのは分かるのですが、それが続かなくても、単体で類似数がもの凄く多い事が結構あるんですね。

これを、どう判断していいか困りました。
 

それと、「分割された文で、25文字未満の文と80文字を超えた部分」はチェック対象外というのも気になります。

実際、元の文と比べてみると、確かに所々文章が飛んでいるんですね。

そして、複数回チェックしたら、毎回結構違う結果が出るんです。

これでは、完璧じゃないなと。
 

そして、いったいどのサイトと似ているのかは皆目分かりませんので、自分の目でチェックしようがありません。
 

クラウドワークスのコピペチェックツール

めばるは、外注さんをクラウドワークスというクラウドソーシングサービスで募集しています。

このクラウドワークスで発注経験がある人限定で、無料でコピペチェックツールを使えるサービスがあるんですね。

クラウドワークスを使って発注してるんで、これを使わないわけにはいかんでしょ!ってとこです。
 

で、実際、使ってみました。

これは、こぴらんとは違って実際に類似サイトがどこか出てきて、自分でもチェックができます。

そして、そのサイトとの類似率みたいなのが何%って感じで出てきます。

クラウドワークスのコピペチェックツール
※CWで発注したことがない人は使えません

けど、これで30%という数字が出てきたら、そのサイトの3割コピペしているのかっていうとそうではなさそうです。
 

そして、納品されたどの記事もそこそこの確率が出ます。

いったい、何%からコピペと判断していいのか分かりません。

試しに自分の完全オリジナルの、参考にしたサイトすら全くない記事でコピペチェックしてみても、そこそこのパーセンテージが出ました。
 

まぁ、こぴらんと違って、クラウドワークスのコピペチェックツールは、どのサイトと類似しているかってのが分かるので、自分の目で確かめたらいいんですが、線引きが分からないから、どこから目視していいのか分かりません。

自分で怪しいと思えば全部チェックすれば良いんでしょうが、そんな面倒な事はしてられません。

目視チェックまでするのは、かなり怪しいと思うやつだけにしたい・・・、けど、そのかなり怪しいラインが分からない・・・
 

とにかく全体的なバランスからして50%を超えたら怪しいという事にしていましたが、なんか使いにくい・・・

こぴらんのように、複数回チェックした場合のバラつきはありませんが、こぴらんとクラウドワークスで、コピペ疑いぽいのが真逆になることもしばしばありました。
 

やっぱ有料のものがいいかな~とか思っていたところで、よさげなコピペチェックツール発見!
 

Copy Content Detector

こぴーこんてんつでぃてくたー?って読むのかな?

ちょっと長ったらしいのでCCDとでも言っておきましょうか。
 

このCCDは、若干判定に時間はかかりますがこんな事をしてくれます。

① web上に似ている文章がないかのチェック
② 単純な文章の一致率計算
③ 自分がコピペチェックしたテキスト間のコピペチェック
④ 連続した文字数が同じ文章を抽出

①と②は細かいことはよくわかりませんが、とにかくパーセンテージだけでなく「良好、要注意、コピーの疑い」という感じで言葉で教えてくれます。

50%を超えると要注意となります。

Copy Content Detector
 

で、めばるが一番重宝しているのが「連続文字数チェック」、これ最長連続文字数が長いものから順に押しえてくれて、その対象サイトも分かるんですね。

具体的に、どこがどう重複しているのか非常にわかりやすいです。
 

まぁ、似たような文章なんていくらでもありますが、これが連続30文字も超えてくるのが偶然で被ることは珍しいでしょう。

一応、連続15文字を超えてくると「要注意」扱いとなってますが、15文字くらいは普通にあります。

25文字を超えると「コピー疑い」です。

ただ、パクっているつもりはなくても、他のサイトを参考にしていれば、これくらいもまぁ、あり得るところです。

そして、文章の内容を見れば、これはしゃーないとか分かります。

これが一つくらいなら、めばるは、文章をちょっと変えてそのまま採用しています。
 

んん? てことは、上手にリライトしてる人は、結構パクっていても、文章の言い回しとか変えてるだけでも、これには引っかかってこないのかな?
 

うん、まぁ、そこは置いていて、ここで問題なのは、このコピー疑いの連続文字列が一つのサイトで複数ある場合ですね。

めばるも、実際に納品された記事でとんでもないのがありました!

平気でコピー記事納品してくる人は、文章の言い回しを変えることすらしないんですね。
 

●実際のコピペ記事納品の話はコチラ
コピペ記事が納品されてきた!
 

大事なお知らせ

めばるは、アドセンスブログ外注化の実践方法をココで学びました!

アドセンスで結果が出ない方、伸びない方、自分でする作業に限界を感じている方は登録しておくべき無料メルマガです。

めばるは、とりあえず記事作成だけの外注で初めましたが、何もかも外注さんに投げて、自分は何もしないって方法も学べます!

 

興味のある方は下のバナーをクリックしてください。 詳しい説明に移動します。

gaityu336.png

コメントフォーム

名前

 

メールアドレス

 

URL

 

 

コメント

検索
自己紹介
はじめまして。当サイトを運営する〝めばる〟と申します<(_ _)>
このブログは、外注化によるアドセンスブログを今から実践していくめばるが、その成長の過程、いや成長しないかもしれない過程を、特に盛ることなく、隠すことなく、赤裸々に日記のごとくアップして行くという試みのものです
自己紹介を詳しく見る >>
最近の投稿
カテゴリー