ドライバーアプリ制作目標@テスト前に音声APIを試してみる

改めて、昔の構想を巻き戻してみた。たぶん簡単には行かないだろうとは思っていたが、まあ並行して色々次々と問題が起こる割には、結果責任も全て押し付けられる毎回のパターンに追われること。

最初に考えたアプリ「音声入力をスマホの待機状態で受け付けて、業務入力や備忘録などのメモをさせる」の構築を続けている。 何でスマホアプリに拘るかは、これがクライアント側から提供された物であることの意味が強い。 クライアントとサービス側を結びつけれる要素として、両者が利益をお互いに高めれる要素というものは少なく、大抵は綱引きになる中で、このスマホアプリの開発での拡張と効率化を高めれれば、これを利用しない手はない、と考える訳です。

別の話が少し落ち着いたため(実際は開店後の方が勝負であり、当面は戦場が続くのでしょうが) 区切れる前の話に戻ると、音声入力なら文字起こしで有名な「Whisper」がある、という所まで区切れる以前は進んでいた。 モデルと料金など、判りやすい情報は非常に豊富だ。

【Whisper】OpenAIの文字起こしツール!モデル一覧、料金体系、APIの使い方を解説 | WEEL OpenAIのWhisperでAI文字起こし!価格・使い方を解説

ただやるなら先ずは、実際に変換テストから行ってみたい。 先ずはローカルのマイクからの音声入力で、変換テストを行ってみようと思う。

HTMLのセキュリティがあるので、そのままでは機能しません。 これは最初、Node.JPを導入してローカルサーバー上で行う予定だったが、 素晴らしいまとめをしてくださっている方がいました。

qiita.com

中でもお手軽そうな「Web Server for Chrome」は、上手く使えなかったので(おそらく筆者の検討レベルが低いせいですが) 最も主流の「Visual Studio Code」の拡張機能「Live Server」より、簡単なローカル環境を実現して、音声テストを行ってみました。

通常にブラウザ機能で、マイクの音声入力を受け付けて、文字として出力できるのですが、 誤差精度を飛躍的に高める技術として、昨今話題にならない日はないAI「OpoenAI」の「Whisper API」で、その精度を自分なりに実感してみることから着手してみました。論理構築より実感がないと進めれないのは、イマイチに周辺環境と基盤が弱いこともありますが。

MEOとか実際の地図とか、SNSとか販促とか、人の流れや嗜好性とか考えて考察してみる

自分はそんな業種ではないので、もちろんこんなことは求められていない。 ただ過去記事に書いたことがある。

ntshackle.hatenablog.jp

先ず、 ファンを増やす>>インスタ、その後に、LINE これは系列店でも直接実施しているケースが普通にある。気分をもり立てて、興味関心を引くためのものとして使われやすい? 相当な負荷でもあるので、インセンティブが必要かも知れない。LINEはコアファン向けのものとして使われるケースが多い?

広報・告知・宣伝>>X(Twitterマーケティング活動として、興味や気分ではない販売戦略として、本部中央が行った方が遥かに効率が良い。 同業他社との比較バランスを考慮した立ち回り、長期的な戦略とアイデアが必要になる。分析必須。

今回はその中でも、モデルケースを規定して、地域マーケティングや販促について、見識とか語ってみる。

地理的な用件 自分みたいな素人にも語れる部分である。 南部に公営の集合住宅を抱えており、年齢層は高齢者が多めだが、交通機関で通勤している現役層も直前を通るため、仕事に必須なものは明快な表側に、レジ通路にはガムなどよく売れるかも知れない。

通路を想定した者向けの流れで、それぞれ分かりやすく区分して、一筆書きで回った時に、ある程度きちんと揃うのが良いだろうか?

店舗の周辺 施策について考えてみる

周辺の店舗分析 決して表通りにあるローソンとの差は、間違いなく不利だろうが決定的なほどには開いていない。 大通りの流れから考えると、 こうしたこと、考え始めると結構面白いことに気づく、まあ無責任でいられる範囲で適当なことを言う、という範囲内でだが。 無料本もあったので、読んでみても良いかも。

実際には、意味があることにするには、APIとか使ったモデルも、一応稼働するまでは仕上げれれば良かっくただたかも知れない。 本筋は仕事がらみ、稼ぐ力の確立であり、次点はスマホアプリでの両者の連結なので、本来は販促など関係は全くない。 ただ地図がトラブっている?ようなので、地図APIのものだけ作っておくことか?正直、後は追っかけてはいられない。

一応やるだけは頑張る、終わったら即座に次のことだが。大抵手元に何も残らないのがいつもだが、ただ今回は一つだけ。

スマホアプリのテスト前に、音声APIを試してみる

以前にドライバーアプリ開発について記載したことがあったのですが、丁度その頃に10年間も長々と打ち合わせをしていた光回線を引く話が、急遽今度は何の打合せもなく決まり、その後は契約者の代わりに調整と確認に追われまくったので、実質計画もほとんど宙に浮いて構想も考え直しのようになってしまった。

改めて、昔の構想を巻き戻してみた。たぶん簡単には行かないだろうとは思っていたが、まあ並行して色々次々と問題が起こる割には、結果責任も全て押し付けられる毎回のパターンに追われること。

それでも関係ない。 最初に考えたアプリ「音声入力をスマホの待機状態で受け付けて、業務入力や備忘録などのメモをさせる」の構築を続けている。 これはリニューアルオープン販促という企画と、更には自身の今後も含めた身分安定の対応とで全て並行で行うので大変だが、 もちろん全部一変に行っていく、他に選択肢がないから。

音声入力なら、文字起こしで有名な「Whisper」がある、という所まで、区切れる以前は進んでいた。(その後例によって光回線の話が) モデルと料金など、判りやすい情報は非常に豊富だ。

【Whisper】OpenAIの文字起こしツール!モデル一覧、料金体系、APIの使い方を解説 | WEEL OpenAIのWhisperでAI文字起こし!価格・使い方を解説

ただやるなら先ずは、実際に変換テストから行ってみたい。 先ずはローカルのマイクからの音声入力で、変換テストを行ってみようと思う。

HTMLのセキュリティがあるので、そのままでは機能しません。 これは最初、Node.JPを導入してローカルサーバー上で行う予定だったが、 素晴らしいまとめをしてくださっている方がいました。

qiita.com

中でもお手軽そうな「Web Server for Chrome」は、上手く使えなかったので(おそらく筆者の検討レベルが低いせいですが) 最も主流の「Visual Studio Code」の拡張機能「Live Server」より、簡単なローカル環境を実現して、 音声テストを行ってみようと思います。

地図MEOに関して試行錯誤する内にぶつかった疑問

少しばかり前から地図MEOを考えるとともに、情報を整理している。 今回、Google Mapsの地理情報修正に関する、手法の問題について疑問にぶつかった。店舗ステータスを何度か更新したのだが、明確な資料の画像を添えた申請であっても、別の申請が優先されたり、次々と書き換えられてしまうのだ。

要するに、寄せられる申請と、証拠となる資料の重さに、ほとんど優劣が考慮されていないのだ。またそうした有耶無耶になる部分を残さないためにも(本当はそこまで必要不可欠とは感じませんが)店舗名や年月日を明確に記載して、取り間違えようがないような資料とするような、用心深さが必要になってくるように感じた。

私自身はそれなりに実績のあるローカルガイドのアカウントを保持しているのだが、何度申請してもニッチモサッチモいかない、そして次々と書き換えられてしまう。これはローカルガイドとして正確な報告を長期間に渡って継続してきた実績も、ほとんど優劣が考慮されていない可能性があるように感じるのだ。これを防ぐにはマイビジネスに登録するしかないのですが、これは仕様としては欠点だろう。嫌がらせや営業妨害へに対処作として、系列店や支店だと自分自身では動けないので手詰まりになってしまう。

また地図シェアでは実質国内2位であるYahoo地図、こちらは休業などのステータスとともに表記はされるものの、地図上から実質なくなったものとして完全に検索されなくなってしまう。これは親切なようでかなり使い勝手が悪い。 つまり店舗側としては、臨時休業や開店前準備中などのステータスを申請しにくい、何しろ地図上から存在が抹消されてしまっているのだとしたら、どういったオーナーや店長が、そうした知らせを行うために、ステータスの申請を行うだろうか?検索して探す側としては便利に感じる向きあるかもしれないが、店舗オーナーの心理としてはあり得ないと思う。廃業ならこの仕様でも問題ないとは思うが、例えば臨時休業や開店準備中の時には致命的なように思う。

特に開店前の売出しをしたい店舗オーナーからすれば、最も資金を投下するであろうタイミングのはず。地図サービスとしてこの段階に店舗オーナーからの積極的な参加の意図を引き出せない仕様は、地図サービスのビジネスとして少々もったいないのように感じた。自分では系列店や支店側からのアイデアを構想する機会はあったりしたのですが、もちろん系列店や支店からではGoogleマイビジネスやYahooビジネスの申請は難しく、口コミ対策などで悪評を何度か挙げられたとしても基本的には打つ手は少ない。偏った一方の都合の仕様を避けたい話もあるかとは思いますが、サポートと開発室に要望としても一応送ってみたので、リアクションが得られたら一応追加で記載していくつもりです。

地図機能やMEOに関して、細々と書き続けていこうと思った

記事としてはけっこう前のお話だけど、MEOについての知識や情報を集積している者にとっては、非常に気になる話題が上っていました。

Googleマップに生成AI利用で場所を探す機能が新登場 - GIGAZINE

対するにYahoo地図は、シェアとしてGoogleMapsの不透明性が取り出たされたころには、シェアを結構伸ばしたように思うのですが、如何せん圧倒的にシェアの差があるにも関わらず、機能性や取り回し・扱いやすさではむしろ水を空けられている。

こちらアメリカでは2024年2月初旬開始とあるので、もうすぐのお話なのですが、基本的には「情報を総括」してくれる機能であるらしい。どちらかと言うと、ゆったりと生きている層には最もありがたい機能になるように思う。ならばシェアとして負けているYahoo地図としては、忙しなく動き回る人が必要とする機能を実装して欲しいと思ったりする。

「目的地に向かう間に、同時にこなしていきたい用件や店舗分野を伝えることで、その有効な店舗を交えた最適なルーティングを示してくれる」

これってドラブイブの上手な人、と目される人が得意とする、かなり高位の能力になるのではないだろうかと、文字にした後に考えてみた。おそらく忙しなく動き回る人にはある種の必然として、磨かれて必要とされる能力だったりするように思う。 分野としては最適経路なんでしょうか、「巡回セールスマンの問題」とか理論は全然判りませんが。 巡回セールスマン問題 - Wikipedia 中心とする目的地そのものを変更したり、どのような最適な経路と時間を得られるかなど、そこまで持っていければソフトウェアの競合優位の機能として、結構なアドバンテージを得られるように思う、実現されたら是非使ってみたいと思います。

開店時間や閉店時間、加えて店舗の特別セールスの日程や時間、店舗や駐車場の混雑する時間。取り分け現状では駐車場の混雑時間は余りデータとしても重視されておらず蓄積されていないように感じるが、実際に例えば外食に行く時には、車庫が混んでいたから別の店に行った/行かれてしまったケースは多分にあるように思うし、そのために余剰の駐車場を確保しておくのだろう。信号や道路進行方向、看板や視認性の問題など、この分野は考え出すと無限に考察が必要で、かつ同時にそれ故に面白くもあり、実際に「地域マーケティング」として捉えるならむしろ、そうした要素のほうが圧倒的に重要であったりもする、らしいのです。ただそれも自分で業界で体当りして試行錯誤してきた訳でもないので、どれだけ積み重ねても憶測の域は出ないでしょう。

この分野だと、参考になりそうな情報は意外に少ないですが、店舗マーケティングに近い分野の漫画がありました。 昔ながらの本なので、今風の感覚に合うかは判りませんが.... 実際の体験が入っているので、読み物としてとても参考になります。


こうした機能やMEOマーケティング的なものについては、おそらく長期的に対応し続ける可能があるように判ってきた。 大して大勢の方に見られているブログでもなく、MEOの分野の専門家にも程遠いので、この記事が特別な売りにつながるとも、自分が強いともとても思えません。ただ 個人ブログのカテゴリーでもそうしたものを設けて、自分なりの知見や試行錯誤の経過を積み重ねていきたいと思う。むしろ何故にこれまで、こうした簡単な積み重ねを行ってこれなかったか、理由はそれなりにあるのですが。

一度やろうと思い立った時以降、明らかに違う方向に強力にミスリードされた続けていたことは覚えている。

とある販売促進のキャンペーンに参加してみて、いろいろ勝手に思った雑感

既存の企画にあれこれ言うのは正味な話、気が進まない。 人の行為に一々にケチを付けているような気分になるからだが、その企業の販売促進につながるという意味でなら別だとも感じた。

福袋を購入したのですが、お菓子が全ての袋にお揃いで入っていました。そこのコンビニで買うには充分に安くて確かにお得な内容だったのですが、揃いのものが全て均等に入ってる内容です。複数個を別店舗で買って回ったので、これは確かだと思う。

懐かしの福袋

全て同じ内容のものなら、確かに文句は出にくいし、パッケージもし易いし、現場で説明や対処もしやすい。 ただ中にもう一品、予想だにしない物がついているともう少し面白くなるなと、従事している人も少し楽しくなって、そんな気持ちが伝わることもあるんじゃないだろうかとも思いました。

ワクワク感の元みたいなもの。 例えば、串かつを購入して食べ終わった串に「あたり」とか書いてあったら、それが例え実際にそこまで意味がなくても嬉しいもの。 手間がかかりすぎると、現場では手に負えなくなるるので、それこそがデジタルが最も重要な役割を果たすべきタイミング。 アプリとバーコードとの連動で、大抵の処理は出来てしまう。この話なら「あたり」の串にバーコードも印刷しておいてアプリでスキャンして貰う。実際はタダのデジタルコンテンツが貰えましたとか、オメデトウのナレーション演出とか、はたまた奮発して(是非とも)大幅割引とか、デジタルなら振り分けの設定し直しも費用がかさまず、企画の終了も再開始も内容の大幅な変更も融通が効く。印刷が崩れやすいと思うのが最大のネックですが、実際はどうなんでしょうか?

企画に継続性が付加されればもっと面白いのではなどとエッラソーにアンケートで書き送ったりもしたのですが、コンビニというものに対する応援の気持ちですので何分ご堪忍を。企画の継続性という意味では、よくあるスタンプラリーを企画していたりする企業もあれば、企画で取り上げたマスコットやタレントを別の企画にも結びつけて起用することで、企画同士を心理的に結びつけてもらって、相乗効果を狙っている企業もあった。コレなんかはどちらが企画としてのこなれ具合が高いかは、比較的に判り易い例だと思う。 企画の継続・連動性としては別の意味で、従来の企画から連動させる形で、ファンのチョットした「オレ、チョット知っている」という心理的な充足感も刺激できる形で企画が次々と連動していったら認知度もけっこう高まるのではと、ヒントを得て考えたこともありました。

元々企画とか勝手に考えるのは好きなのですが、デジタルを絡ませると構想も広がります。これ実際に見積もりとか市場調査とか、最低限でも実際に出来ていけたらそれなりに価値を持たせることも出来るのでしょうか?こんなアプリ出来たらなと構想していたジャンルとも似通ったところがあったので、色々考えをまとめておいて、中々環境をまとめ切るまで行かないでいるメモアプリObsidianの整理とに蓄積していく日々です。 obsidian.md

ドライバーアプリの関連と、他の改題とを少し

Amazonセールがやっていたので、Alexa Autoを購入してみました。 この「カーアクセサリー」少し解りにくいのですが実際の機能は限定的で、要するに車内向けに雑音に強く設計された、スマホAlexa向けのマイクのようです。 調べてる時間が足りなかったのもありますが、正直よほど精度が高くならなければ要らなかったかなと。ドライバーアプリ関連がどれくらい向上してきているかの興味で購入したのが実際の理由ですが。私のような貧乏人には元々の値段 7,980円の半額でも高かったように思いました。ただエアコンの吹き出し口近くに設置しても大丈夫との謳い文句のあるマイクの精度は、ひょっとしたら他にも流用できるかも知れないのでそこは楽しみでもあります。少し面白かったのがスマホのAlexa画面が「運転中モード」としてシンプルになっていること。停車中はともかく運転中は画面は視ない、が取締りルールでもある。インターフェースで重要なのは信号待ちでも使えるように、やはり操作回数の少なさになるのだろうか。

実際には間に合わず取り付けるタイミングも他の作業で埋まってしまってズレてしまったので、運用テストまでは出来ていない。ただ音声インタ‐フェースを構想したり試したりする時に、またAlexaアプリを開発して行く時があれば活きてくるのかな。ただ実際には運転中は速度が命、ということがけっこう多い。もし業務にも活かせるアプリを構想していくなら、 ダイレクトでショートカットを多用できるレスポンスとしての音声応答が必須になってくるんだろうな、とは感じたました。もちろん趣味の分野で使いにはその限りではないので、ケースごとに違った作りが必須になってくるのだろうと。

ただこのまま行けば、家電の再来のように飲まれる可能性が高いんじゃないだろうかと改めて感じさせられる。現状では確かに、賛否両論という声もあるこのAlexa Autoは、完成度としてはまだまだ不足点の方を多く感じる。しかしやり方の上手さというかきちんと普及への手順を踏んでおり、スマートスピーカーの操作や設定をそのまま持ってこられるので習熟も早く移行もスムーズだ。完成度がある程度まで行けば、Alexaスピーカーの利用者がそのままAuto利用者になることを望めるのみならず、相乗効果も期待できる。これは残念ながら国産の機器には相変わらず全く欠けている戦略分野。 この分野はシェア上位の総取りなので、スマートスピーカーの分野で巻き返すのは難しいだろう。お得意の個々の作り込みを行なっても、各個撃破されて勝負になりにくいのではと。

狙い目があるとすれば、まだ業界標準というか上位が確定されておらずSwitchBotのようなスマートリモコンの分野でないかと思うのですが、ユーザー側が慣れたインターフェースの共通化が必須なので、普及習熟まで間に合うかどうか。

後は以前の、労働環境でも進めていけるような形と企画で、情報共有のための WEBベースを作成していくことですが、構想ではクイズを適当に解いてもらう形式のコンテンツと、情報源として便利なサイトアドレス集や、機器のマニュアル集を上手く切り替えて呼び出せるものが出来たらと考えて進めていました。コンテンツ一つでもそれなりに説得力を持ったものをきちんと作ろうとするには時間がかかるのが普通でしょうから、呼び出し側の共有基盤と、取り敢えず判り易いコンテンツだけでそれ以上は難しいだろうから、後で徐々に作り込んで行けれればと。

スマホ向きではChatGPT-AIを活用したものを考えて退職した恩人の他にも、親戚の叔母に贈るものとしてEchoShowも準備したが取り敢えずの形でしか用意できず、世の中のAIな流れと進化発展に追いつけていません。それと全く理解のない家人とは段取りに兎に角も時間と手間がかかり、もう一人のみかん星人がいる土日には、基本的に全く段取りは進まなくなる。直接というより場の空気がそうなってしまうので、人生の歩をコツコツ進める系の段取りすら完全に度外視されて、例えテレビ観戦をうまく途中で抜けるまでの話題であっても、最大限何もしなくなることが最上の価値になるので苦しいなぁ。