キーフレーズ抽出で振り返る2022年の業界別ニュース

ML

Anews について業界別2022年のキーフレーズキーフレーズの抽出キーフレーズのスコアリングさいごに参考文献本記事は、Stockmark Advent Calendar 2022 の 12 日目の記事です。年の瀬といえば流行語大賞ですね。今年 2022 年も大谷ルールやオミクロ…

2022-12-02

顧客体験の向上に向けた自然言語処理技術の活用: 定義文抽出

ML

はじめに自然言語処理とは構造化事例: 定義文抽出定義文のニーズ定義文抽出の流れ抽出結果今後の展望記事の出典はじめにこんにちは、Researcherの北山です。今回は自然言語処理技術を用いてAstrategyにおける顧客体験向上のための取り組みを行った…

2022-12-01

CIは命綱 - 開発プロセスで意識・工夫していること

Development

スキーマ駆動による開発効率化 Over Fetching を生み出さないAPI設計価値のベースラインを保つリグレッションテスト継続的なライブラリバージョンのメンテナンス CIは命綱「推測するな、計測せよ」によるユーザー体験の向上まとめストックマーク Co-VPo…

2022-10-19

月間1.6億秒の Lambda x Node.js 利用から得られた知見

Development

はじめになぜ Node.js なのか? なぜ AWS Lambdaなのか？ Lambda x Node.js でスクレイピングする際の落とし穴落とし穴その1: Puppeteer がクラッシュする落とし穴その2: Lambdaが最大並列実行数に到達しない落とし穴その3: 巨大なXMLの存在落とし穴 …

2022-08-29

プレスリリース駆動開発で起こった3つの変化

Development

先に実物を紹介プレスリリース駆動開発を起因とした3つの変化 1. 顧客のアトラクト強化 2. プロダクトオーナー自身の気づきによる新機能の洗練化 3. より効果的な画像が作成できるようにまとめストックマークではプロダクト開発の方法として、プレスリリ…

2022-06-22

開発チームのスケールに向けたブランチ戦略見直し

Development

概要背景：GitHubのブランチ戦略がチームスケールの弊害に変更前の運用：コンフリクトと調整コストのトレードオフ変更後の運用：ブランチ戦略見直しとFeature Flagの導入今後に向けて概要組織の拡大に伴う開発チームの分割、独立性向上のためにGitHub…

2022-06-13

個別最適でプロダクトを作り続けたスタートアップがデータ専任部隊を作ることにした話

Development

ストックマークのプロダクトはデータに支えられている「何もしてないのに壊れる」のではなく「何もしてないと壊れる」 Phase0: どちらのプロダクトが対応する？ Phase1: 役割の一部を明確化 Phase2: データチームの切り出しへ Phase3: データプラットフォー…

2022-05-02

日本語ニュース分類から見る多言語モデル

ML

ニュースタイトル分類タスクでの実験英語での fine-tuning の効果クラス別の精度評価 NAC での degradation おわりに引用 Appendix: モデルの設定グローバル化が進む現代において、様々な言語で情報収集を行う必要性がこれまで以上に高まっています。Sto…

2022-04-27

検索エンジンのMore-Like-Thisクエリとグラフアルゴリズムによる類似記事集約

ML

はじめに類似性グラフの構築グラフの構成要素の抽出バッチ計算まとめ本記事は Grouping Similar Articles with Search Engine More-Like-This Queries and Graph Algorithms の翻訳記事です。以前の記事である More Like This Query を活用した類似記事…

2022-04-14

Grouping Similar Articles with Search Engine More-Like-This Queries and Graph Algorithms

ML

Introduction Building Similarity Graph Extracting Graph Components Batch computations Concluding Remarks Please refer here for a related post in Japanese. Introduction In Stockmark, we collect tens of thousands of news articles from thousa…