前回の記事を書いたのが4月8日でしたね。
かなり時間が空きましたが、WELQより返事が来ました。
8件、流用があったようです。
でも正直良くわからんね。
と言うのは印象です。
だって、その記事読んでいないんですもの。
DeNAさんが行った手法が全文検索ですね。
つまり、当院のブログの記事とWELQの記事の文章を全部検索して、
そのうちの何%が一致しているかを見ていく。
その数値がある程度以上であれば流用と考える。
という手法です。
でも、「てにおは」変えればすぐに文章の一致率を下げることができますよね。
また、文章の前後を少し入れ替えるだけでも一致率は下がりますよね。
ということもあり、その数字自体が信用できない状態になっています。
また、記事を書いたライター向けにマニュアルが出回っており、
その中には記載をある程度変更するように書いてあったりもするわけです。
DeNAリライトマニュアルの巧妙すぎる手法(週間東洋経済オンライン2016/12/9)
つまり、全文検索をして出てきた結果と、記事の流用状況の間の相関関係は
より下がってくるわけです。
逆に当たり障りのない文章を書いていても、全文検索をすれば一致するわけです。
猿がキーボードを売っていれば、シェークスピアがいつか書けるというアレですね。
なので、真相が全然わからないのです。
それなのに、貴院の記事なのかそうでないのか判断してって言われてもどうすればいいの?なわけです。
結局、当てはまりそうな文章を全部読み込んでみて、流用がないか判断をしなければいけないのです。
最終的には人海戦術。
記事を流用するのはコピペで一瞬でできますが、その検証にはものすごく時間がかかるのです。
ただね、それはやらかした側はしっかりとやる責任があるわけですし、
流用された側もそれを簡単にみすごすと、それが前例になって、次にも同じようなことが起こるのです。
なので、今回の件はそれだけはきっちりと行いたい。
特に誰かの健康にダイレクトに関わる情報なので、そこは忘れないようにしないといけません。
流用されてしまった側に余計なコストと手間を掛けるという、明らかに二次被害なんですが
ただ、できるだけのことはしていかなければいけないな。と思うわけです。
まだまだこの話、終わりは見えません。
当院からもこの結果について再度問い合わせを行っています。
その返事を気長に待ちたいと思います。
ただね、風化だけはさせてはいけないですよね。